Алгоритми трансформування вихідних зображень з урахуванням ортогональних перетворень. Алгоритми цифрової компресії зображень з використанням ортогональних перетворень

Перетворення, які використовуються для стиснення зображень, повинні бути швидкими і, по можливості, легко реалізованими на комп'ютері. Це передусім передбачає, такі перетворення мають бути лінійними. Тобто, перетворені величини є лінійними комбінаціями (сумами з деякими множниками або вагами) вихідних величин (пікселів), причому відповідним множником або вагою є деяке число (коефіцієнт перетворення). Значить, де . Наприклад, при цьому перетворення можна записати в матричній формі

,

яка у випадку набуде такий вид: . Кожен вектор-стовпець матриці називається "базисним вектором".

Важливим завданням є визначення коефіцієнтів перетворення. Основна вимога полягає в тому, щоб після перетворення величина була б великою, а решта величин стали б малими. Основне співвідношення передбачає, що буде більшим, якщо ваги посилюватимуть відповідні величини . Це станеться, наприклад, якщо компоненти векторів мають близькі значення і однакові знаки. Навпаки, буде малим, якщо ваги будуть малими, і половина їх матиме знак, протилежний знаку відповідного числа . Тому, якщо виходять великі , то вектори мають подібність до вихідного вектора , а малі означають, що компоненти сильно відрізняються від . Отже, базисні вектори можна інтерпретувати як інструмент вилучення деяких характерних ознак вихідного вектора.

На практиці ваги не повинні залежати від вихідних даних. Інакше їх доведеться додавати в стислий файл для використання декодером. Це міркування, і навіть те що, що вихідні дані є пікселами, тобто, неотрицательными величинами, визначає спосіб вибору базисних векторів. Перший вектор, той, який, породжує, повинен складатися з близьких, можливо, чисел, що збігаються. Він посилюватиме невід'ємні величини пікселів. А решта векторів базису повинні наполовину складатися з позитивних чисел, а на іншу половину - з негативних. Після множення на позитивні величини та їх складання результат буде малим числом. (Це особливо вірно, коли вихідні дані близькі, а ми знаємо, що сусідні пікселі мають, зазвичай, близькі величини.) Нагадаємо, що базисні вектори є деяким інструментом для отримання особливостей вихідних даних. Тому гарним виборомбудуть базисні вектори, які сильно відрізняються один від одного і тому можуть витягувати різні особливості. Це призводить до думки, що базисні вектори повинні бути взаємно ортогональні. Якщо матриця перетворення складається з ортогональних векторів, перетворення називається ортогональним. Інше спостереження, що дозволяє правильно вибирати базисні вектори, полягає в тому, що ці вектори повинні мати все більші частоти зміни знака, щоб видобувати, так би мовити, високочастотні характеристики даних, що стискуються при обчисленні перетворених величин.

Цим властивостям задовольняє наступна ортогональна матриця:

. (3.5)

Перший базовий вектор (верхній рядок ) складається з одних одиниць, тому його частота дорівнює нулю. Всі інші вектори мають дві +1 і дві -1, тому вони дадуть невеликі перетворені величини, які частоти (виміряні кількістю змін знаків у рядку) зростають. Ця матриця подібна до матриці перетворення Адамара Уолша (див. рівняння (3.11)). Наприклад, перетворимо початковий вектор (4,6,5,2):

.

Результат цілком підбадьорливий, оскільки число стало більшим (порівняно з вихідними даними), а два інших числа стали малими. Обчислимо енергії вихідних та перетворених даних. Початкова енергія дорівнює , а після перетворення енергія стала , що вчетверо більше. Енергію можна зберегти, якщо помножити матрицю перетворення коефіцієнт 1/2. Новий твір буде рівним. Отже, енергія зберігається і концентрується у першій компоненті, і вона тепер складає від загальної енергії вихідних даних, у яких частку першої компоненти припадало всього 20%.

Інша перевага матриці полягає в тому, що вона робить зворотне перетворення. Вихідні дані (4,6,5,2) відновлюються за допомогою твору.

Тепер ми можемо оцінити переваги цього перетворення. Квантуємо перетворений вектор (8.5,1.5,–2.5,0.5) за допомогою його округлення до цілого та отримуємо (9,1,–3,0). Робимо зворотне перетворення та отримуємо вектор (3.5,6.5,5.5,2.5). В аналогічному експерименті ми просто видалимо два найменші числа і отримаємо (8.5,0,-2.5,0), а потім зробимо зворотне перетворення цього грубо квантованого вектора. Це призводить до відновлених даних (3,5.5,5.5,3), які дуже близькі до вихідних. Отже, наш висновок: навіть це просте та інтуїтивне перетворення є гарним інструментом для «вичавлювання» надмірності з вихідних даних. Більш витончені перетворення дають результати, які дозволяють відновлювати дані з високим ступенем схожості навіть при грубому квантуванні.

Одні художники відображають сонце у жовте
плями, а інші жовті плями в сонці.
- Пабло Пікассо

  • Спеціальність ВАК РФ05.13.11
  • Кількість сторінок 382
Дисертація додати до кошика 500p

ПОНЯТТЯ ТА ПРОБЛЕМИ

1.1. Основні підходи до проблеми компресії зображень

1.1.1. Математична модель дискретного зображення

1.1.2. Міра помилки відновлення зображень

1.1.3. Вихідні ідеї методів компресії статичних зображень

1.1.4. Варіант JPEG, що базується на застосуванні ДКП

1.1.5. Проблема вибору базисів розкладання

1.2. Використання вейвлет-перетворень для компресії статичних зображень

1.2.1. Основні поняття, визначення, специфіка вейвлет-перетворень

1.2.2. Двовимірні вейвлет-перетворення

1.2.3. Основні ідеї сучасних алгоритмів вейвлет-компресії зображень

1.3. Особливості обробки відеопослідовностей

1.4. Загальна постановка задачі оптимізації кодування із втратами

Введення дисертації (частина автореферату) на тему "Математичні методи та алгоритми цифрової компресії зображень з використанням ортогональних перетворень"

Проблеми, пов'язані зі зберіганням, обробкою та передачею зорових образів (зображень), супроводжували людство протягом усієї його історії. Поява телебачення безпосередньо пов'язала завдання обробки зображень із завданнями обробки електричних сигналів, а розвиток цифрової електроніки призвело до того, що повсюдний перехід від аналогових форм подання сигналів до цифрових характерною рисоюсучасні електронні системи. У зв'язку з цим питання цифрової обробки зображень (ЦОІ) набувають сьогодні особливої ​​актуальності.

Дискретне чорно-біле напівтонове зображення можна задати деякою матрицею, елементи якої (точки зображення, також звані пікселями) являють собою отримані в результаті деякої просторової дискретизації відліки функції, що описує розподіл яскравості на безперервному зображенні. Цифровим зображенням називатимемо матрицю, отриману в результаті квантування поелементного (з кінцевим числом рівнів) значень відліків дискретного зображення. Для опису кольорового зображення (дискретного або цифрового) потрібно вже три матриці, що відповідають трьом компонентам яскравості в обраному колірному просторі, наприклад RGB (red, green, blue). Опис зображення у вигляді матриць яскравості будемо називати безпосереднім уявленням.

Обробка, зберігання, передача цифрових зображень за безпосереднього представлення вимагають колосальних обсягів даних. Так, наприклад, для запису одного кадру високоякісного кольорового зображення розміром 1024x1024 точки, при кодуванні кожного відліку 24 бітами (8 біт на колірну компоненту), потрібно 3 мегабайта даних. Звичайно, при перегляді відеороликів допустима менша роздільна здатність екрану, проте, для демонстрації цифрового відеофільму в реальному масштабі часу необхідна передача даних зі швидкістю близько 160 мегабіт/с. Сказане пояснює той величезний інтерес, який проявляється у всьому світі до пошуків шляхів ефективного кодування зображень.

Вже на зорі розвитку цифрових методівобробки зображень (кінець п'ятдесятих - початок шістдесятих років) надмірність безпосереднього представлення зображень була очевидною, проте найпростіші способи, що застосовувалися для стиснення даних, такі як диференціальна імпульсно-кодова модуляція з наступним статистичним кодуванням, давали більш ніж скромні результати. Постановка питання про застосування частотних методів для стиснення зображень стала можливою завдяки появі в 1965 році роботи Кулі та Тьюкі, що містила опис алгоритму швидкого обчисленнядискретного перетворення Фур'є (ДПФ) Ідею заміни зображення як безпосереднього об'єкта кодування відліками його двовимірного спектру ДПФ було висунуто 1968 року. Кодування за допомогою використання ДПФ ґрунтується на тому, що для більшості зображень природного походженняЗначення багатьох коефіцієнтів ДПФ порівняно малі. Такі коефіцієнти можна часто взагалі відкинути, або відвести з їхньої кодування малу кількість біт, без ризику внести значні спотворення. В 1969 Претт, Ендрюс і Кейн запропонували використовувати для кодування зображень замість перетворення Фур'є перетворення Адамара , що в багатьох практичних випадках дозволяє значно зменшити обсяг необхідних обчислень. Після цього було здійснено дослідження щодо застосування для кодування зображень дискретних перетворень Карунена-Лоева і Хаара. Перетворення Карунена-Лоева є оптимальним у тому сенсі, що забезпечує мінімальну середньоквадратичну помилку кодування при відкиданні частини коефіцієнтів-трансформант, проте вимагає, на жаль, знання статистичних характеристик зображень, що обробляються, і не має швидкого алгоритму обчислення ; перетворення

Хаара, навпаки, характеризується дуже ефективним алгоритмом обчислення, але дає, зазвичай, порівняно велику похибку кодування . У 1971 році Шибата та Еномото запропонували спеціально для використання в кодуванні зображень так зване похилий перетворення векторів з 4-х або 8-ми компонентів. Незабаром після цього Претт, Чен та Уїлч розробили узагальнений алгоритм похилого перетворення векторів великої довжини та двовимірних масивів.

Всі переваги кодування зображень з використанням ортогональних перетворень випливають з особливостей розподілу енергії серед елементів-трансформант - завдяки цьому узагальнений двовимірний спектр1 більш зручний для кодування, ніж зображення у вихідному поданні . Внаслідок значних кореляційних зв'язків між елементами зображення природної природи основна енергія в дискретному спектрі має тенденцію концентруватись у відносно невеликій кількості відліків, що відповідають повільно осцилюючим базовим функціям. Тому, без істотної шкоди для подальшого відновлення зображення, малі за величиною спектральні коефіцієнти можна взагалі обнулити, а елементи спектру, що залишилися, оцифрувати (проквантувати і закодувати). Тут доречно відзначити, що використання алгоритмів стиснення із втратами даних для реальних зображень фотографічного характеру (тобто напівтонових) носить важливий характер, оскільки, припустившись наявність певної помилки у відновленому зображенні, можна досягти набагато вищого рівня стиснення даних. Помилка може бути настільки мала, що не сприйматиметься людським оком. Крім того, зображення, отримані

1 Скрізь термін спектр ми розумітимемо узагальнено, як результат унітарного перетворення (не обов'язково по ДПФ) одномірного або двовимірного набору даних. сканером або цифровим пристроєм відеовводу, неминуче мають шумову складову, точне збереження якої при кодуванні не має сенсу.

Як показано Ахмедом та ін., У застосуванні до кодування зображень, для яких підходить марківська статистична модель, дискретне косинусне перетворення (ДКП), що має швидкий алгоритм обчислень, наближається за ефективністю спектрального представлення даних до перетворення Карунена-Лоева (див. також ). Цей факт став причиною того, що саме ДКП послужило основою при розробці стандарту стиснення нерухомих зображень JPEG. Зазначений стандарт став плодом багаторічних зусиль. колективу фахівців, утвореного у 1987 році з представників двох авторитетних міжнародних організацій: ISO та ITU. Поява об'єднаної групи JPEG була викликана зростанням кількості розробників і користувачів різних систем ЦОІ і уніфікації формату стисненого представлення цифрових зображень, що випливала з цього. Вироблена в результаті специфікація стала документом, якого сьогодні дотримуються майже всі розробники програмних систем ЦОІ загального призначення. З 1994 року виробляються спеціалізовані мікросхеми, що реалізують стиснення та відновлення по JPEG апаратно та забезпечують обробку кольорових зображень у реальному масштабі часу (480x640 пікселів, 30 кадрів/с). З точки зору досяжного рівня стиснення, варіант JPEG, заснований на використанні ДКП, не є найкращим серед існуючих методів ефективного кодування зображень. Так, методи, що базуються на використанні вейвлет-перетворень2 можуть забезпечити значно вищі рівні стиснення - з цієї причини в розширеному стандарті JPEG2000,

У вітчизняній літературі замість прямого перекладу слова wavelet часто використовується також термін сплеск. існуючим у вигляді попередньої (draft) специфікації з 2000 року3 вже передбачена можливість застосування вейвлет-перетворень. Однак говорити про те, що стиснення зображень з використанням ДКП себе повністю виживає, на сьогоднішній день передчасно, оскільки порівняно з вейвлет-перетвореннями обчислювальні витрати, необхідні для реалізації ДКП, набагато менші. Більш докладний огляд сучасних методів компресії зображень і відмінностей у підходах, що використовуються, буде дано в розділі 1 цієї роботи.

Важливість проблеми компресії даних при обробці зображень важко переоцінити - досить проаналізувати зростання кількості відповідних публікацій, що спостерігається в останнє десятиліття. Так, значну частину змісту щомісячного журналу IEEE Transactions on Image Processing, що видається з 1992 року, становлять статті, присвячені саме цій темі. Не можна не помітити також і той факт, що алгоритми стиснення зображень і теорія, що лежить в їх основі, розробляються в основному за кордоном, перш за все, в США. Звичайно, говорити про відсутність вітчизняних робіт у цій галузі не можна, проте необхідність значного розширення російського фронту досліджень не викликає жодних сумнівів.

Складність алгоритмів, що використовуються для компресії зображень, неухильно зростає - сказане стосується не тільки обсягу обчислень, а й ідейних основ побудови алгоритмів: у їхньому фундаменті складним чином переплітаються функціональний аналіз, теорія ймовірностей, теорія інформації, дискретна математиката алгебра. Разом з тим завдання ставляться практикою, що вимагає при їх вирішенні неухильного і постійної увагидо можливостей реальної апаратури

3 2 січня 2001 року частина 1 «JPEG 2000 Image Compression System: Part I Core Coding System» остаточно затверджена для прийняття офіційним міжнародним стандартом ISO/IEC 15444-1.

Таким чином, завдання дисертаційної роботи було визначено як дослідження теоретичних питаньефективного кодування зображень з використанням ортогональних перетворень та розробка відповідних алгоритмів стиснення, придатних для практичного застосування на базі універсальних обчислювальних засобів загального призначення. Новизна роботи визначається вперше запропонованими для вирішення поставленого завдання алгоритмами та методами, що виносяться на захист (див. нижче). Актуальність обумовлена ​​прикладною спрямованістю роботи та винятковою важливістю проблеми стиснення даних у ЦОІ.

У першому розділі дисертації наводяться необхідні для подальшого викладу попередні відомості. короткий оглядта класифікація основних підходів до реалізації ефективного кодування зображень Використання алгоритмів стиснення з втратами даних для напівтонових зображень носить повсюдний характер: припустившись наявності помилки у відновленому зображенні, можна досягти набагато вищого рівня компресії даних. Найчастіше якість обробки зображень прийнято оцінювати за середньоквадратичною помилкою (СКО):

СКО = X у) 2 > де ~ матриця вихідного зображення, Л

Х = (х/у) - матриця зображення, отриманого після обробки (стиснення та відновлення даних). Для логарифмічної величини СКО використовується загальноприйнятий захід PSNR (peak signal to noise ratio)

255 значення сигналу до шуму), PSNR = 201g-[дБ].

Методи стиснення зображень зручно розглядати як загальної схеми, що з трьох основних етапів: зниження міжелементної кореляції даних, квантування елементів даних, статистичне кодування. Квантування є основним прийомом стискування із втратами. По суті справи,

N-1M-1 квантування є виділення з вхідних даних деякої основної частини інформації, коли її менша частина опускається. Застосовується як скалярне, і векторне квантування. У скалярному випадкуелементи оброблюваного набору даних квантуються незалежно один від одного.

Переведення зображення в узагальнену спектральну область за допомогою деякого лінійного перетворення може значно знизити міжелементну кореляцію в матриці-трансформанті У=77(Х) в порівнянні з кореляцією елементів в матриці дискретного зображення X. Тоді незалежне покомпонентне кодування вектора У, а не вектора X, стає ефективнішим. Можна також дати енергетичне трактування мети використання перетворень, яка в такому розумінні полягає в концентрації максимальної частини енергії вихідного дискретного сигналу (матриці X) мінімальної кількості спектральних коефіцієнтів (елементів матриці У). Між розподілом енергії в узагальненому спектрі і властивостями перетворень, що декорують, є певний зв'язок. Вивчення ефективності властивостей, що декорують, таким чином, є важливим завданням при виборі перетворення для застосування в схемі компресії.

Реальні фотографічні зображення є двовимірними сигналами, що мають неоднорідності (особливості) на областях контурів об'єктів, тому базис функцій, що використовуються для розкладання, повинен мати хорошу локалізацію в області зображення. Однак у фонових областях зображення може розглядатися як реалізація стаціонарного сигналу, що робить переважним використання для розкладання частотно-локалізованого базису (відомо, що коефіцієнти тригонометричного розкладання стаціонарного сигналу некорельовані). Домогтися одночасно високої роздільної здатності в частотній і в часовій областях неможливо через принцип невизначеності Гейзенберга.

Можливим виходом є використання функціональних базисів вейвлетів (сплесків), які мають змінну час-частотну роздільну здатність. Підходи, пов'язані з використанням сплесків, на сьогоднішній день є домінуючими в обробці нерухомих зображень, поступово витісняючи традиційний інструмент декореляції – дискретне косинусне перетворення (ДКП).

У першому розділі наголошується, що для оптимізації алгоритмів стиснення даних із втратами часто використовується підхід, заснований на мінімізації RD-функції Лагранжа. Нехай X - деякий вхідний набір даних, якому в результаті виконання процедури стиснення-відновлення ставиться у відповідність< выходной набор данных той же природы, Y=F(X,и), где u=(u\,.,un) - набор управляющих параметров алгоритма сжатия F. СчитаемX, Y элементами некоторого пространства Q с метрикой D(X, Y), множество всех возможных значений управляющего вектора и обозначим U. Задача оптимизации кодирования состоит в том, чтобы для заданного набора входных данных X и максимально допустимых битовых затрат Rb найти такие параметры и* = (щ,.,и*п) алгоритма F, чтобы ошибка кодирования данных D(X,Y)=D(X,F(X,\i)) принимала бы минимальное значение. То есть

D(X,F(X, u)) = D(X, u) = minZ)(X,u), asU (0.1)

Пошук розв'язання задачі (0.1) у більшості випадків зводиться до громіздких чисельних процедур ітераційного характеру. Якщо не задаватися обмеженням R(X,u)

У першому розділі також коротко відзначаються особливості, пов'язані з обробкою (стисненням-відновленням) динамічних зображень. Основним перетворенням, що використовується для відеокомпресії, поки залишається ДКП, як більш просте в плані обсягу обчислень в порівнянні з вейвлет-перетвореннями. Як і статичної компресії, алгоритми кодування відео найчастіше є складнішими проти алгоритмами декодування. Реалізація програмної компресії відео в реальному масштабі часу таким чином накладає суттєві обмеження на допустиму складність обчислень.

Другий розділ присвячений вивченню методів теоретичного аналізу декорелюючої ефективності перетворень, призначених для використання в стиску даних. Запропоновано новий метод, який ґрунтується на оцінці величини безумовної ентропії коефіцієнтів перетворення та спирається на наступні міркування. Нехай відома матриця Кваріаційна Кх вихідного вектора даних

Х = (х0,л;1,.,д:Дг1)г, вектор-спектр У отриманий в результаті деякого ортогонального перетворення з матрицею У=ЛУХ. Опускаючи викладки, середню безумовну ентропію коефіцієнтів вектор-спектру можемо записати:

Нср = - X | /к (щ, х)\про%/к (тк,ок,х)4х =

0.3) Л к=0 к=0 функція щільності розподілу ймовірностей для

1 Аг-1 1 1\-11 1

Л°(х)1о/Лх>/х; 1 лг де /к(тььих) спектральної характеристики ук (Аг-ой компоненти вектора У), /і^-математичне очікування, ок - середньоквадратичне відхилення, /к(х) = Чим менша середня ентропія (0.3), тим ефективнішим буде наступне незалежне кодування компонент спектра.

Як критерій декорелюючої ефективності пропонується розглядати отриману з формули (0.3) в результаті певних перетворень величину середньої надмірної ентропії, яка виражається через елементи матриць Кх = (соу(хг., г і = (і;,., ^Т1,.) наступним чином :

1\ ^ ае1^х к = 0 у- = 0 ^

Величина (0.4) неотрицательна, причому що більше її значення, тим нижче ефективність декоррелирующего перетворення з матрицею Численні розрахунки величини (0.4) щодо різноманітних перетворень і видів коваріаційних матриць показали результати, що повністю узгоджуються з відомими даними .

Великий інтерес для аналізу представляє модель дискретного сигналу (вектора X), що має статистику дискретного марковського процесу першого порядку, коли матриця коварії має такий вигляд:

N-2 рК-1 рМ-2

Ця модель часто використовується і для опису міжрядкової та міжстовпцевої кореляції в дискретних зображеннях. При р=1, коли усі компоненти у вихідному векторі X однакові (для будь-яких двох відліків вектора коефіцієнт кореляції дорівнює одиниці), розрахунок введеного критерію (0.4) для матриці (0.5) неможливий, т.к. у цьому випадку маємо<ЫКХ = 0. Вместе с тем, на фоновых областях изображения р->1. У розділі 2 доводиться така теорема.

Теорема 2.1. Для будь-якої ортогональної матриці (Л/х/У) такий, що

V/ = ОД,. ,ЛГ -1: >у0. = -(базисна функція з нульовим індексом є лА/У нормована постійна складова) та коварійної матриці (0.5) лм/ 2 N-1 N-1

1іпДЯ(\У,Кх)= - \о%

Різні дослідження, у тому числі проведені в розділі 2, показують, що серед дискретних перетворень, що мають швидкі алгоритми обчислень (для розмірності N арифметичних операцій, що реалізуються за -Шо^Ы) найбільш близькі до оптимального перетворення Карунена-Лоева характеристики декореляції для марківського процесу (0.5 ) дає використання ДКП. Незважаючи на наявність добре опрацьованих швидких алгоритмів обчислення, ДКП принципово вимагає для реалізації виконання операцій множення і за обсягом обчислень помітно поступається, наприклад, перетворенням Хаара, Уолша, Крестенсона-Леві. p align="justify"> Окремим питанням, розгляду якого приділено значну увагу в розділі 2, є побудова (синтез) нового перетворення, що має як високі характеристики декореляції для моделі (0.5), так і значно швидші, ніж для ДКП, алгоритми обчислення. Отримане в результаті дискретне псевдокосинусне перетворення (ДПКП) визначено для векторів такої розмірності А, для якої можливе розкладання N = N1. -Ип, причому У до (2,3,4). Тоді матриця ДПКП (у разі нижній індекс свідчить про розмірність перетворення) будується як пряме (тензорне) твір елементарних матриць ДПКП (\¥2,\¥з,\У4): = \¥Лг1 ®. ® \Ул,п, причому елементарні матриці ортогональні і являють собою отримані в результаті певних модифікацій матриці ДКП відповідної розмірності4. Елементарні матриці представлені у вигляді добутку деякої діагональної матриці Б на матрицю С, а структура дозволяє реалізувати множення на довільний вектор і, СІ, тільки за допомогою операцій складання і віднімання чисел.

З властивостей тензорного твору випливає уявлення = ОдгСд, де діагональна матриця ®, а матриця

Див =Сщ ®.®Сип. Структури матриць С2, С3, С4, В2, Б3, Б4 наводяться в розділі 2. Таким чином, реалізація ДПКП У = Уд, Х = Б^С^Х полягає в реалізації множення матриці См на вектор, У = С^Х, і подальшому нормуванні отриманого вектора У: У = Б^У. Для обчислення ДПКП зручно використовувати швидкі алгоритми, засновані на факторизованому поданні для матриці Оу у вигляді твору слабозаповнених матриць5: Сдг = ТдГ] ТдГ~1) ■.■ ТдР, де Т#> =1^ ^ 1„м «. »1^,

1дг. - Поодинока матриця розмірності ТУ. хА/" -. Оскільки матриці Тд/)

J J J складаються з певним чином розріджених матриць-блоків, множення матриці Тд/) на вектор також зводиться тільки до операцій складання та віднімання чисел. Швидкі алгоритми зворотного ДПКП будуються

4 Під тензорним (прямим) добутком матриць (/=0,.,7]-1; т= 0,.,А-1) і О^^) (к-0,., у-1; 7=0, .,/¿-1) розуміємо матрицю

8=В®С=К/))= . ,а = 0Х., щ- \, р = 0Х., 1йг \.

5 Для обґрунтування справедливості цього подання див. с.84-85 з монографії. аналогічно, т.к. в силу ортогональності ДПКП:

Зазначимо, що необхідне при обчисленні ДГШП та зворотного ДПКП нормування (множення на матрицю Ду) для схеми стиснення зі скалярним квантуванням коефіцієнтів перетворення не тягне за собою ускладнення обчислень . Нормування може бути об'єднане при стисканні даних з етапом скалярного квантування у^ - гоіпс1(у7/с() шляхом вибору для кожного елемента у. перетвореного індивідуального кроку квантування qj=qldjj (де

Елемент діагональної нормувальної матриці Б^). При відновленні вектора У~ У, у ту ■, множники для елементів у ^ слід вибирати також індивідуально, у вигляді

Як показав теоретичний аналіз, для моделі (0.5) ДПКП має більшу ефективність декореляції в порівнянні з іншими швидкими перетвореннями, реалізація яких також зводиться тільки до операцій складання та віднімання чисел.

Третій розділ присвячено вивченню питань застосування для стиснення зображень дискретного перетворення Крестенсона-Леві (ДПКЛ) та є розвитком досліджень кандидатської роботи автора.

Система функцій Крестенсона-Леві (хт на напівінтервалі хе = і(Л О на діагоналі матриці розмірності рпхрп знаходяться р матриць розміру рпЛхрпЛ інші елементи матриці - нульові). Матриця п) =(Щк) (,Д=0,1,.,/ -1) має такий вигляд: м>м = ч ди"к~1, де кх=к(то&р), ]п =[¡1 рп~1\то&р), ^=ехр(-2т/р), 8 ™ = \ Прит ( . 0, при т. Ф 7

Дискретні (цифрові) напівтонові зображення описуються у вигляді речової матриці X. При обробці речових векторів (матриць) спектр ДПКЛ розпадається на пари комплексно сполучених елементів, тому частину елементів спектра можна не обчислювати. Облік цих особливостей дозволив запропонувати для обробки речових масивів алгоритми ДПКЛ та зворотного ДПКЛ з неповним обчисленням. При обробці речових наборів даних можливе також застосування суміщених перетворень, аналогічно тому, як це робиться при обчисленнях дискретного перетворення Фур'є. При цьому з двох речових векторів X та X2 формують комплексний вектор Х=Х1+/Х2 та виконують перетворення.

Якщо використовувати комплексних чисел г=хНу подання у базисі (1 г=а+Рд е~2л"/3), то обчислення ДПКЛ (при р= 3) може бути виконано без використання операцій множення (нормуючий множник

1/4р", див. (0.7) - не враховується), за допомогою операцій складання та віднімання (даний факт встановлений А.В.Єфімовим). Використання в алгоритмах з неповним обчисленням базису (1,д) тягне за собою ряд особливостей, які розглядаються в розділі 3. При розмірності матриці зображення ЗпхЗг обчислення ДПКЛ або зворотного ДПКЛ за алгоритмами з неповним обчисленням вимагає виконання 7(п+г)-3"+г"1 операцій складання (віднімання), операції множення та поділу не використовуються. базису (1,<7) в вычислительном плане является более эффективным и для алгоритмов совмещенных вычислений. Специфика, которую налагает использование ДПКЛ и базиса (1,#), а также необходимые для реализации совмещённых ДПКЛ и обратного ДПКЛ формулы , получены в главе 3.

Для обробки нерухомих зображень у кандидатській роботі автора було запропоновано алгоритм компресії, в якому вихідне зображення розбивається для обробки на елементарні фрагменти X, 9x9 пікселів, і кожна матриця-фрагмент обробляється за допомогою ДПКЛ (за алгоритмом з неповним обчисленням). У розділі 3 наведено короткий опис алгоритму компресії, який підтвердив обґрунтованість використання дискретного перетворення Крестенсона-Леві для стиснення зображень. Характер помилок, що вносяться в процесі стиснення-відновлення, різний для заснованого на ДКП методу JPEG і для запропонованої схеми: при використанні JPEG має місце "розмивання", в той час як нова схема стиснення призводить до "зубчастості" зображення. Тим не менш, суб'єктивне якість сприйняття при використанні обох розглянутих способів стиснення приблизно однаково. Оцінки величини спотворень за величиною PSNR, виконані для низки тестових зображень розмірності 720x504=362880 точок, також дали близькі результати: для одних зображень може спостерігатися незначна перевага заснованого на ДКП стандарту JPEG, для інших зображень найкраща якість відновлення можлива при використанні нового методу. Відмінності невеликі, особливо при низьких рівнях стиснення. Оцінки обчислювальних витрат показують, що алгоритм на основі ДПКЛ не поступається JPEG і частини, що стосується обчислювальної складності реалізації. Алгоритм компресії зображень, що використовує ДПКЛ і має порівняні з JPEG характеристики, є результатом, вперше отриманим автором.

У четвертому розділі розглядаються питання розробки схем стиснення, що використовують пофрагментну обробку зображень. Зазвичай для подібних схем найефективнішим є використання ДКП, тому вивченню його властивостей, необхідні побудови алгоритмів компресії, присвячена значна частина четвертої глави. Т.к. двовимірне ДКП є роздільним перетворенням (зводиться до одновимірним перетворенням вздовж рядків і вздовж стовпців оброблюваної матриці), то багато властивостей двовимірного ДКП випливають із властивостей одновимірного.

Для коефіцієнтів одновимірного ДКП, що визначається формулою, отримано наступне співвідношення (Ь*Ю): кк (0.8) вт- #

2И де А/=ху-Ху 1 - перші різниці відліків вихідного вектора даних Х = (л; 0, д: 1,., л: лг1) Т. Формула (0.8) показує, що різниці А,- мають різний характер впливу спектр ДКП. Так, різниця Аш-хш-х^/2-\ (при парному IV) входить у всі коефіцієнти у2ш з максимальними за модулем (поодинокими) вагами. Різниця між відліками х0 і взагалі не входить у (0.8), що принципово відрізняє ДКП від його «прабатька» - дискретного перетворення Фур'є, амплітудний спектр якого інваріантний до циклічних зрушень (х0->х)->.->Хл>-1- >*о) компонент вектора даних X.

У припущенні некорелюваності різниць6 А; і рівності нулю їх математичних очікувань Е(А/)=0 досліджувалися також імовірнісні оцінки, зокрема величина сумарної дисперсії змінних складових спектра ДКП: Е - ¿,0(ук). Ця сума надається через к= 1 дисперсії перших різниць вектора даних наступним чином: Е = -^ | S (j) D (Aj), де ¿"(у) - деякий ваговий коефіцієнт. Доведена

Теорема 4.1: для коефіцієнтів $(/) правильне співвідношення: Ця теорема знову підтверджує, що і для ймовірнісної моделі вектора X різниця Ат (в даному випадку, її дисперсія) робить найбільший внесок. Чим ближче номер різниці до N/2, тим більше значенняваги £(/") і тим більший внесок робить різницю А, в енергію змінних складових. Дослідження спектрів ДКП для деяких характерних

6 Для марківської моделі (0.5) це припущення неправильне. сигналів також підтвердило, що при використанні прийомів кодування спектрів з JPEG (зокрема кодування серій нулів - run-length encoding) ефективність кодування погіршуватиметься у випадку, коли інформаційна насиченість дискретного сигналу буде припадати на центральні відліки вектора.

Крім вивчення загальних властивостей ДКП, у четвертому розділі досліджується можливість оптимізації кодування за схемою JPEG, що зберігає формат вихідних даних. У розвиток ідей роботи Crouse-Ramchandran запропоновано алгоритм , що здійснює додаткову оптимізацію скалярного квантування коефіцієнтів ДКП, що тягне за собою деяке підвищення характеристик стиснення за стандартом JPEG за рахунок малого ускладнення процедури оптимізації.

Для стиснення статичних зображень з використанням ДКП 8x8 у четвертому розділі розроблено новий алгоритм, який відрізняється від JPEG етапом ентропійного кодування, для якого використовується кілька статистичних моделейта алгоритм багатопоточного арифметичного кодування. Вибір моделі провадиться певним чином за контекстом вже оброблених даних. Запропонований алгоритм арифметичного контекстного кодування коефіцієнтів ДКП підвищує стиснення даних на 10% порівняно зі стандартною схемою JPEG (еталоном служила програма JPEG Optimizer™ v.4.0, див. http://xat.com).

Значну увагу у четвертому розділі приділено вивченню загальних теоретичних та практичних аспектів застосування векторного квантування (ВК) для компресії зображень у галузі перетворень, не обов'язково з використанням ДКП. Для цього спектри фрагментів зображення необхідно розбити на певні зони, кожна з яких відповідає окремому потоку даних, що піддається ВК. Сформулюємо зад^ту розбиття корелированного набору даних, який представимо у вигляді вектора Y, на кластери (класи) . Вихідними параметрами є коваріаційна матриця Ку вектора У та обмеження на максимальну невизначеність (ентропію) НтаХ для кожного кластера у розбиття. Потрібно знайти таке розбиття безлічі випадкових компонентів У=(70,.,ГЛг1) на підмножини

У(А) = ^„.„У^], к=1,.,М, щоб:

Ъ*"^ . (О,) я(у^)квазіоптимальних способу : алгоритм «Вирощування кластерів» і алгоритм «Виділення сильних зв'язків». Обидва запропоновані способи чисельного пошуку рішення (0.9) засновані на мінімізації ентропії міжкластерних зв'язків

Нсв(\а\.,\(м)) = ^Н(\(к))-Н(У). Ближчі до оптимального к=1 задовольняє (0.9)) розбиття показав другий з названих алгоритмів.

На закінчення, у четвертому розділі запропонована загальна схема компресії, що використовує адаптивне ЫЭ-оптимизированное ВК області спектрів фрагментів зображення. Тобто. формалізовано загальну схему стиснення статичних зображень з використанням векторного квантування в області ортогональних перетворень, орієнтовану на пофрагментну обробку зображення.

П'ята глава присвячена вивченню та розробці алгоритмів компресії нерухомих зображень у галузі вейвлет-перетворень. Нехай тепер

W = позначає матрицю дискретного вейвлет-спектру, отриману в результаті двовимірного л-крокового вейвлет-перетворення матриці дискретного зображення. Кількість кроків вейвлет-перетворення визначає число частотних рівнів у спектрі, для кроків маємо л+1 рівень. При цьому коефіцієнти вейвлет-розкладання можна впорядкувати у вигляді сукупності деревоподібних структур (7), корінням яких є елементи, що лежать у низькочастотному діапазоні спектру (саббенді), див. малюнок. Подібне упорядкування визначає для вейвлет-коефіцієнтів (вузлів дерева) зв'язку виду «батько-нащадки». Ідейні основи розробленого алгоритму стиснення сягають корінням у роботи Lewis-Knowles і Xiong-Ramchandran-Orchard; при цьому основне завдання, яке стоїть перед алгоритмом компресії, полягає в пошуку RD-оптимальної топології (тобто структури S, яка виходить після підрізування гілок вихідного дерева Т), що мінімізує функцію Лагранжа для фіксованого значення Я: J(S*) = тт [Д£) + ЯR(S)].

Ідея, яка сягає роботи і в тому ж вигляді використовується в , полягає в наступному: чим більша абсолютна величина вейвлеткоэффициента I wj (або енергія, wf) вузла-батька /, тим менш імовірна поява у даного вузла нульової (тобто підрізаної) ) гілки, що слід використовувати для кодування топології дерева S. Більш точне передбачення появи нульової гілки можна скласти, якщо використовувати як прогнозну величину Р, суму, що включає в себе, крім wf, також квадрати значень вейвлет-коефіцієнтів, сусідніх у саббенді до вузла i. Проведені у розділі 5 експериментальні дослідженнястатистичних залежностей показали доцільність використання для прогнозної ев-------- ЄВ величини Р( зваженої суми з абсолютних значень коефіцієнтів-сусідів. Необхідні значення вагових множників були встановлені в результаті статистичної обробки вейвлет-спектрів реальних фотографічних зображень. Для кодування топології «підрізаного» дерева £ кожному вузлу г дерева приписується ознака наявності (гц = 0) або відсутності (пг- 1) в даному вузлі підрізаної гілки. нові елементи даних (Ту,) Останні піддаються адаптивному арифметичному кодуванню, причому використовується кілька статистичних моделей, контекстне (тобто за вже закодованими даними) правило вибору моделі визначається певним чином за прогнозними величинами (Т5,-).

Для кодування скалярно проквантованих вейвлет-коефіцієнтів, які не потрапили в нульові (підрізані) гілки, також використовують декілька статистичних моделей. Запропоноване правило контекстного вибору моделей враховує як значення прогнозної величини Р(вузла-батька, так і значення вейвлет-коефіцієнтів сусідніх вузлів, які знаходяться в тому ж саббенді, поряд з оброблюваним, але вже закодовані). Wj = XQш \ ^ (Wjlд), відповідного вузлу у дерева Б, здійснюється за величиною л, = 0.36Р н-1.0б (1 У

М?; ]<1 где ]у - узел-сосед по вертикали, х - узел-сосед по горизонтали,/^ - узел-сосед по диагонали. Значения весовых множителей, фигурирующие в прогнозной величине зу, были получены в результате экспериментов по обработке реальных изображений.

Порівняння результатів, отриманих в експериментах обробки реальних зображень, з результатами застосування інших відомих алгоритмів вейвлет-компресії зображень показує, що запропонований алгоритм має дуже високі показники. Так, для відомого тестового зображення Lena при рівні стиснення 0.5 біт піксель (16 разів) помилка PSNR=37.66 дБ.

Завершальні дослідження глави 5 відносяться до побудови гібридної схеми кодування вейвлет-спектру, коли на додаток до описаного вище способу підрізання гілок вейвлет-коефіцієнтів допускається також можливість векторного «самоквантування» гілок, яке може трактуватися як фрактальне кодування в області вейвлет-перетворень наприклад, ). Отриманий у результаті гібридний алгоритм вимагає значно більшого обсягу обчислень, проте фрактальна складова кодування при цьому виявилася практично повністю пригніченою базовою схемою вейвлет-компресії, заснованої на підрізуванні гілок. Необхідно відзначити, однак, що «змичка» підходів у гібридному алгоритмі була зроблена нескладним способом і можливості подальшого розвитку залишають тут широке поле для досліджень.

Шоста глава присвячена дослідженню алгоритмів стиснення динамічних зображень з метою побудови схеми відеокомпресії, придатної для програмної реалізації в реальному масштабі часу на базі персональних комп'ютерів.

Кадром відеопослідовності називаємо матрицю пікселів з Mi рядків і М2 стовпців: B=(bkj), А:=0,1,.,МГ1, /=0,1,.,М2-1, а під терміном відеопослідовність розуміємо впорядкований набір кадрів В0 ,! * 1,. , Вг,. Назвемо (у, х)-блоком кадру (у, х-цілочисленні координати) деяку підматрицю BytX=(bkii), де k=y,y+\,.y+Ni-\, 1=х>х+\,. у+ИгА. У розробленому алгоритмі кожен кадр відеопослідовності розбивається при обробці на суміжні матриці-блоки (BWj) розміром 8x8, т,п=0,8,16. Якщо будь-який блок відеопослідовності виявився у певному сенсі «схожий» на оригінальний блок Вт, вважаємо, що блок В1т>п - це переміщений фрагмент B^J попереднього кадру, і для кодування (т,п)блоку зображення достатньо задати координати блоку в попередньому кадрі, у них, або зміни координат у-т і х-п. як новий. Такої ідеології випливають сучасні міжнародні стандарти відеокомпресії MPEG, Н.261-Н263, причому всі вони спираються також на використання ДКП для кодування нових блоків.

Розробка нового алгоритму відеокомпресії проводилась у рамках загального підходудо RD-оптимізації стиснення із втратами. У розробленому алгоритмі вибору способу кодування чергового оброблюваного блоку В1т п керуємося критерієм мінімуму функції Лагранжа для блоку: J(b)-D(b)+?iR(b). Припустимо, що аргумент Ъ=0 відповідає кодуванню переміщеного (нерухомого) блоку, а ¿=1 - нового. Тоді якщо J(l)>/(0), то блок кодується як переміщений, і як новий - інакше.

При використанні RD-оптимізації завдання пошуку переміщених блоків формулюється в такий спосіб . Для заданого (т, я)-блоку В1т п ¿-ого кадру знайти в попередньому відновленому кадрі такий (у,х)-блок л., щоб мінімальне значення набувала RD-функція Лагранжа

Щу-т,х-п) = mintein-B^ +AK(w-m,v-n)l (0.10) tt,v)e£2 і " "

В-В т, п у, х

Тут враховано, що координати знайденого блоку кодуватимуться як відносні, тобто. вектором переміщень г=(у-т,х-п).) Гарантовано знайти мінімум (0.10) можливо лише при повному переборі елементів (і,у)е£1, а для того, щоб алгоритм пошуку можна було реалізувати в реальному масштабі часу , Як область Про необхідно розглядати лише точки (у, і), досить близько розташовані до точки (т, п). Підвищення ефективності пошуку за рахунок розширення області С2 досягається застосуванням різних алгоритмів спрямованого пошуку, орієнтованих на мінімізацію помилки уявлення переміщеного блоку ||в"га>п, що відповідає окремому випадку (0.11) при Я = 0. Алгоритми спрямованого пошуку знаходять мінімум (0.11) приблизно, проте за рахунок істотного розширення області пошуку зазвичай дозволяють знайти більшу кількість переміщених блоків, при аналогічній повному перебору складності.

У шостому розділі запропоновано новий алгоритм спрямованого пошуку переміщеного блоку , орієнтований на наближене рішення задачі (0.10) для довільного значення X. Відмінною особливістю запропонованого алгоритму і те, що малі переміщення блоків зображення шукаються точніше , т.к. повинні суворо відстежуватися через специфіку візуального сприйняття. Для підвищення ефективності отриманого в розділі 6 алгоритму пошуку для вектора переміщення (А,АХ) блоку, що обробляється, слід будувати прогноз по векторам переміщення (д^Л^) і (д*Д) двох вже оброблених «сусідів» (відповідно сусіда по вертикалі і сусіда по горизонталі). Власне прогноз - це відносні координати (у0, * 0), які визначають перенесення центру області пошуку: з точки (т, п) до точки (ш, п) = (т + у0, п + х °). Експериментально підтверджено, що кількість нових блоків зображення скорочується на 5.25%, якщо прийняти наступне правило складання прогнозу:

0,0), обидва сусідні блоки - нові

Д^Д^), по горизонталі - новий, по вертикалі - переміщений (Ану, Акх), по горизонталі - переміщений, по вертикалі - новий ((д; , ДУХ) + (ТАК, ДАХ),) / 2, обидва сусіди - переміщені блоки

Наслідуючи ідеологію стандарту MPEG, у розробленій схемі компресії обробка нових блоків також здійснюється за допомогою квантування з наступним статистичним кодуванням коефіцієнтів двовимірного ДКП. Результат ДКП блоку Ось>і позначимо S, S=F(BW>„). Також позначимо: Se=fe;/=round(5M/^i;))^=0, Q = кД/=0 - одна з матриць квантування JPEG. Для статистичного кодування матриці S застосований алгоритм контекстного кодування, запропонований у розділі 4, який введений додатковий етап RD-оптимізації. Нехай ZQ =(z0,.,z63)

Вектор, отриманий в результаті зигзагоподібного зчитування даних із матриці SQ за правилом, що визначається стандартом JPEG (S0<->ZQ). RDоптимізація статистичного кодування можлива за рахунок подовження нульових серій компонент у векторі ZQ шляхом їхнього додаткового обнулення. Для того, щоб у результаті не відбулося помітного ускладнення алгоритму кодування, в оптимізованому варіанті алгоритму контекстного кодування ДКП-коефіцієнтів аналізується лише можливість збільшення фінальної нульової серії, що дає найбільший внесок у додаткову мінімізацію функції J(Zq)=D(Zq)+ÀR( Zq). У цьому вважається, що матриця Q, визначальна квантування коефіцієнтів ДКП, задана. Універсальний алгоритм кодування повинен оперувати деяким набором матриць квантування (Q/) з можливістю вибору необхідної матриці для конкретних вимог до якості та рівня стиснення. Якщо набір матриць досить великий, то підбір матриці квантування Q за принципом мінімуму функції J(Zq) перетворюється на громіздку процедуру, яка не реалізується в реальному масштабі часу стандартними засобами. Крім того, при великому діапазоні можливих значень індексу j його кодування кожного нового блоку окремо тягне неприпустимо високі додаткові бітові витрати. Тому в якості вихідного набору було обрано лише кілька матриць з множини, що рекомендується JPEG, які відповідають найкращому, найгіршому та деяким проміжним рівням якості. У дослідах використовувалося число матриць |(Q/)|=4. Для прискорення виконання операцій поділу, які необхідні при квантуванні, елементи матриць (Q,) були заокруглені до найближчого значення 2к, k=G,\,. Такий підхід дозволяє замінити операції цілочисленного поділу та множення зсувами розрядів двійкового представлення чисел, які зазвичай виконуються реальною апаратурою набагато швидше.

Крім використання алгоритму контекстного кодування коефіцієнтів ДКП (з розділу 4), у шостому розділі запропоновано альтернативний алгоритм статистичного кодування, в якому проквантовані спектри ДКП розбиваються на фіксовані області, що формують окремі (незалежні) потоки даних для арифметичного кодування, та запропоновано експериментальну методику для побудови розбиття спектрів на такі сфери. Незважаючи на те, що в загальній схемі компресії відео вибір був зроблений на користь першого алгоритму кодування спектрів, застосування арифметичного кодування з фіксованим розбиттям спектрів на області незалежного кодування може виявитися кращим при використанні інших (відмінних від ДКП) перетворень, а також у схемах компресії , що використовують векторні квантування спектрів. Наприклад, у схемі, яка розглянута у розділі 4. (Використання векторного квантування в алгоритмах реального масштабу часу важко.)

При дослідженні характеристик підсумкового алгоритму відеокомпресії для оцінки величини помилки кодування у відновленій послідовності В0,В1,.,ВЛ:~1 використовувалося відношення пікового значення сигналу до шуму, яке визначалося таким чином:

PSNR = 101g ¿III

ДБ], де Mi та M2 задають розмір кадру в пікселях. Для експериментів було обрано широко відомі тестові послідовності News, Container ship, Hall monitor, Akiyo, Claire. Результати чисельних експериментів, отримані аспірантом Ф.В.Стрєлковим, показали, що у всіх тестах запропонована схема компресії дає високі результати, перевершуючи характеристики кодера MPEG-2, розробленого групою MSSG (mpeg2encode, версія 1.1, див. http://www.mpeg.org/MSSG). Програмне стискування відеопослідовностей при цьому здійснюється в реальному масштабі часу.

Підсумок дослідженням, проведеним у дисертаційній роботі, підбивається у заключному розділі - «Основні висновки та висновок».

На захист дисертації виносяться такі основні результати:

Метод оцінки декорелюючої ефективності ортогональних перетворень та засновані на ньому алгоритми кластеризації корелюваних даних;

ДПКП та швидкий алгоритм його обчислення;

Новий швидкий алгоритм ДПКЛ та його модифікація – алгоритм з неповним обчисленням; алгоритм поєднаних обчислень ДПКЛ для обробки речових масивів у базисі (1,ехр(-2то/3));

Метод компресії зображень, що ґрунтується на спеціальному способі арифметичного кодування спектрів ДПКЛ блоків зображення;

Детерміновані та ймовірнісні оцінки коефіцієнтів ДКП;

Алгоритм контекстного кодування спектрів ДКП зображень;

Загальна схема компресії зображень на основі векторного адаптивного квантування в області ортогональних перетворень;

Алгоритми вейвлет-компресії статичних зображень;

Алгоритм пошуку переміщених блоків зображення;

Експериментальна методика побудови розбиття спектрів у сфері незалежного кодування;

Алгоритм відеокомпресії.

Основні результати, викладені у дисертації, опубліковані у 30 роботах. Усі теоретичні результати, що наводяться в дисертації, з 11 написаних у співавторстві робіт отримані особисто автором. У тих випадках, коли експериментальні чисельні дані (таблиці, графіки), що наводяться, із спільних робіт були отримані співавторами, на це явно зазначено по ходу викладу при цитуванні результатів.

Запропонований у шостому розділі алгоритм відеокомпресії був реалізований програмно в рамках робіт, що проводилися в ГУ НВК «Технологічний Центр» Московського державного інституту електронної техніки та в НВП «Технологія». Впровадження розроблених бібліотек відеокомпресії здійснено у ряді програмних систем, що проводять обробку відеозображень (у тому числі кодування) в реальному масштабі часу, серед яких найбільший практичний інтерес представляє система відео контролю та реєстрації Visual Security (див. http://www.tcen.ru /Vs). Копії документів про використання та впровадження результатів дисертаційної роботи є у додатку 6.

Висновок дисертації на тему "Математичне та програмне забезпечення обчислювальних машин, комплексів та комп'ютерних мереж", Умняшкін, Сергій Володимирович

ВИСНОВКИ І ВИСНОВОК

У представленій дисертаційній роботі досліджено різні аспекти застосування дискретних ортогональних перетворень для цифрової компресії зображень як з боку суто формального теоретичного аналізу, так і з боку тих вимог та обмежень, які практика накладає на конкретні обчислювальні схеми та алгоритми. У цілому нині зміст роботи носить прикладну спрямованість, тому більшість теоретичних результатів підкріплено обчислювальними експериментами, результати яких, своєю чергою, як служили ілюстрацією чи перевіркою теорії, але часто давали поштовх і були вихідний матеріал для подальших пошуків.

За результатами проведених у дисертаційній роботі досліджень можна зробити такі висновки.

1. Ортогональні перетворення є основним інструментом для декореляції даних при компресії зображень. У разі коли математична модель дискретного сигналу задається коварійною матрицею, для аналізу ефективності декорелюючої обробки доцільно застосування запропонованого в роботі критерію середньої надмірної ентропії.

2. Спеціально для стиснення корельованих даних отримано та вперше введено до розгляду дискретне псевдокосинусне перетворення (ДтСП). У схемі компресії, що передбачає наявність етапу скалярного квантування коефіцієнтів перетворення, серед розглянутих швидких перетворень, реалізація яких зводиться тільки до операцій складання-віднімання (Уолша, Хаара, псевдокосинусна), ДПКП дає найкращі результатидекореляції для дискретного сигналу, що описується марківською моделлю.

3. З використанням отриманих швидких алгоритмів ДПКЛ, що враховують специфіку обробки речових масивів, запропонована схема компресії зображень на основі арифметичного кодування коефіцієнтів ДПКЛ досягає характеристик, які за якістю обробки та обчислювальної складності близькі до варіанта JPEG на основі ДКП.

4. При використанні статистичного кодування коефіцієнтів ДКП методом JPEG наявність «стрибків» дискретного сигналу найменш бажано у центральній області фрагментів обробки.

5. Високу ефективність застосування в різних схемах та алгоритмах стиснення даних має метод багатомодельного (багатострумового) арифметичного кодування, а одним із ключових моментів у розробці схем компресії є визначення правил для вибору поточної моделі кодування за контекстом вже оброблених даних. Так, застосування у схемі JPEG запропонованого у розділі 4 алгоритму багатомодельного контекстного арифметичного кодування коефіцієнтів ДКП підвищує ефективність стиснення даних на 10%.

6. При стисканні зображень з використанням багатомодельного кодування деревоподібних структур вейвлет-спектрів правило вибору моделей слід будувати за комбінованим контекстом, який враховує як оточення самого вейвлет-коефіцієнта в саббенді, так і оточення коефіцієнта-батька. Отриманий на цій основі новий ефективний алгоритм компресії цифрових зображень з втратами, розроблений за результатами вивчення статистичних властивостей спектрів дискретних вейвлет-перетворень, показує високі характеристики стиснення при складності реалізації, прийнятної для широкого коладодатків.

7. Для усунення міжкадрової (тимчасової) надмірності відеоданих найбільш доцільним для практичного застосування серед досліджених алгоритмів блокової компенсації переміщень слід визнати запропонований гібридний алгоритм спрямованого пошуку, при якому малі переміщення шукаються точно і ретельно, а значні переміщення - грубіше.

8. При використанні запропонованого алгоритму відеокомпресії, який був розроблений на основі RD-оптимізаційного підходу з урахуванням вимог та специфіки програмної реалізації, досягається стиснення та відновлення відео в реальному масштабі часу на базі сучасних персональних комп'ютерів, за високої якості обробки.

Результати проведених досліджень відбито у 30 друкованих працях, доповідалися та обговорювалися на багатьох всеросійських та міжнародних конференціях. Загалом у дисертаційній роботі отримано нові наукові результати, теоретичні положення яких дозволили значною мірою розвинути та формалізувати процедури аналізу та синтезу схем компресії цифрових зображень, заснованих на використанні дискретних ортогональних перетворень.

Вироблені підходи та рекомендації призвели до побудови конкретних схем та алгоритмів компресії, багато з яких були реалізовані програмно та експериментально підтвердили ефективність свого застосування. Результати досліджень з відеокомпресії, які проводилися в рамках очолюваних автором НДР та фінансувалися Міністерством науки і промисловості РФ, запроваджено у вигляді алгоритмів у програмно-апаратній системі Visual Security (див. додаток №6).

Список літератури дисертаційного дослідження доктор фізико-математичних наук Умняшкін, Сергій Володимирович, 2001 рік

1. Абстрактні алгебраїчні системи та цифрове оброблення сигналів / Вариченко Л.В., Лабунець В.Г., Раков М.А. Київ: Наукова думка, 1986. –248 с.

2. Алексєєв А.Г. Кластеризація корельованого набору даних // «Мікроелектроніка та інформатика 99». VI всерос. міжвуз. н.-т. конф. ст. та асп.: Тез. док. - М: МІЕТ, 1999. - С.133.

3. Ахмед Н., Pao К. Ортогональні перетворення під час обробки цифрових сигналів: Пер. з англ. М.: Зв'язок, 1980. – 248 с.

4. Ватолін Д. С. Гібридна схема фрактальної компресії та квантування векторів для малих блоків // Праці міжнародної конференції Graphicon-98. Москва, 1998, стор 205-212.

5. Віленкін Н.Я. Про один клас повних ортогональних систем // Изв. АН СРСР. Сер. мат. 1947. – Т.П. – С. 363-400.

6. Воробйов В.І., Грибунін В.Г. Теорія та практика вейвлет-перетворення. -С.-Пб.: Вид-во воєн. ун-ту зв'язку, 1999. 204 с.

7. Гашніков М. В., Глумов Н. К, Сергєєв В. В. Інформаційна технологія компресії зображень у системах оперативного дистанційного зондування // Із Самарського центру РАН. 1999. – № 1. – С. 99-107.

8. Голд Би., Рейдер Ч. Цифрова обробка сигналів: Пер. з англ. М: Рад. радіо, 1973. – 368 с.

9. Блакитне Б.І., Єфімов A.B., Скворцов В. А. Ряди та перетворення Уолша: Теорія та застосування. М.: Наука, 1987. – 344 с.

10. Горлов С.К., Користін А.В., Родін В.А. Про одну реалізацію методу стиснення відображень за допомогою нелінійної апроксимації сум Фур'є-Хаара// Теор. функцій та прибл.: Тр. 7-й Саратов, зим. шк. (1994 р.). Ч. 2.-Саратов: Вид.-во СГУ, 1995.

11. Дмитрієв В.І. Прикладна теорія інформації: Навч. для студ. вишів. -М.: Вищ. шк., 1989. 320 с.

12. Єфімов A.B., Поспєлов A.C., Умняшкін C.B. Деякі властивості мультиплікативних ортонормованих систем, що використовуються в цифровій обробці сигналів // Праці математичного інституту ім. В.А.Стеклова РАН. Т.219. – 1997. – З 137-182.

13. Єфімов A.B., Умняшкін C.B. Швидкі алгоритми обчислення дискретного перетворення Крестенсона-Леві та оцінки його спектральних. Показників// Теор. функцій та прибл.: Тр. 7-й Саратов, зим. шк. (1994 р.). Ч. 2. - Саратов: Изд.-во СГУ, 1995. С. 9-20.

14. Жуков В.Г. Дослідження методів порівняння переміщених блоків зображень у алгоритмах стиснення відеопослідовностей. //Мікроелектроніка та інформатика-99. Всерос. міжвуз. н.-т. конф. студентів та аспірантів: Тези доповідей. М.: МЙЕТ,1999. – С. 137.

15. Жуків ДМ. Еквівалентність одновимірного та двовимірного перетворення Крестенсона-Леві // Методи цифрової обробки зображень: Зб. наук. тр. МІЕТ. М: МІЕТ, 1982 - С. 65-70.

16. Задирака В.К., Євтушенко В.М. Оптимальний спосіб зонного кодування з використанням Слент-перетворення // Кібернетика та системний аналіз. 1994. - №4. - с. 56-60.

17. Дослідження та розробка алгоритмів програмного стиснення даних із втратами для цифрової обробки відеозображень: Звіт про НДР (закл.) / HI 111 «Технологія»; рук. -Умняшкін C.B. "Дозор"; № держ. per. 01200004624; Інв. №100704. – Москва, 2000. – 48 с.

18. Кендел М. Рангові кореляції. М: Статистика, 1975. - 216 с.

19. Коваленко КН., Філіппова А.А. Теорія ймовірностей та математична статистика. М: Вища. школа, 1982. – 256 с.

20. Корн Г., Корн Т. Довідник з математики для науковців та інженерів: Пер. з англ. М.: Наука, 1970. – 720 с.

21. Кочетков М.Є. Компресія цифрових зображень з використанням векторного квантування в області ортогональних дискретних перетворень: Дисс. канд. техн. наук. М., 1999. -191 с.

22. Кочетков М.Є., Умняшкін C.B. Багатопотокова реалізація алгоритму арифметичного кодування/М.: МДІЕТ (ТУ), 1998. 21 с. Депоновано у ВІНІТІ 25.12.98 № 3884-В98.

23. Кочетков М.Є., Умняшкін C.B. Про порівняння критеріїв з оцінки ефективності декорелюючих перетворень / М.: МГИЭТ (ТУ), 1998. 34 з. - Деп. у ВІНІТІ 13.04.98, № 1069-В98.

24. Лесін В.В., Лісовець Ю.П. Основи методів оптимізації: Навч. допомога. - М: Вид-во МАІ, 1998. 344 с.

25. Лісовець Ю.П., Поспєлов А. С. Мультиплікативні голографічні перетворення для обробки зображень // Методи цифрової обробки зображень: Зб. наук. тр. М: МІЕТ, 1982 - С. 100-109.

26. Літош І.П. Об'єднання алгоритмів фрактальної та вейвлет-компресії цифрових зображень// «Мікроелектроніка та інформатика -2001». У1П всерос. міжвуз. н.-т. конф. ст. та асп.: Тез. док. -М.: МІЕТ, 2001. -С.147.

27. Марков А.А. Стиснення цифрових зображень з використанням \vavelet-перетворень // «Мікроелектроніка та інформатика 2000». VII всерос. міжвуз. н.-т. конф. ст. та асп.: Тез. док. -М.:МІЕТ, 2000. -С. 114.

28. Мудре А.Є. Численні методи для ПЕОМ мовами Бейсік, Фортран та Паскаль. - Томськ: МП "РАСКО", 1991. -272с.

29. Новіков І.Я., Стєчкін С.Б., Основні конструкції сплесків // Фундаментальна і прикладна математика. 1997. – Том 3. – №4. -С.999-1028.

30. Нуссбаумер Г. Швидке перетворення Фур'є та алгоритми обчислення згорток: Пер. з англ. М: Радіо і зв'язок, 1985. - 248 с.

31. Пєєв Є., Боянов К, Бєлчева О. Методи та засоби за компресія на зображення // Автоматика та інформатика.-1994.-28, №3.-стор.3-14.

32. Пєтухов А.П. Введення у теорію базисів сплесків. СПб.: Вид-во СПбДТУ, 1999. 132 с.

33. Поспєлов А. С. Методи обробки цифрової відеоінформації з використанням перетворень голографічного типу// ​​Зб. тр. міжнар. совіщ. за програмою. та мат. методів вирішення фіз. завдань (Дубна, 14-19 червня 1993 р.). Повідомлення ОІЯІР11-94-100. – З, 71-73.

34. Поспєлов А. С. Деякі математичні задачіта алгоритми цифрової обробки інформації з використанням дискретних перетворень: Дис. на соїск. уч. степ, д-ра фіз.-мат. наук. М., 1992. -398 с.

35. Застосування цифрового оброблення сигналів: Пер. з англ. / За ред. Е. Оппенгейма. М: Світ, 1980. – 552 с.

36. Прет У. Цифрова обробка зображень: Пер. з англ. М: Мир, 1982. -Кн.1 і 2.-312 і 480 с.

37. Прет У, Кеш Д., Ендрюс X. Кодування зображень за допомогою перетворення Адамара // ТІІЕР. 1969. – Т.57. - №1. – С. 66-77.

38. Птачок М. Цифрове телебачення. Теорія та техніка / Пер. з чешок, за ред. Л.С.Віленчика. М.: Радіо та зв'язок, 1990. -528 с.

39. Розанов Ю.А. Випадкові процеси. М.: Наука, 1971. – 288 с.

40. Свішников A.A. Прикладні методи теорії випадкових функцій. М.: Наука, 1968.-463 с.

41. Трахтман В.А. Спектральний аналіз у базисі функцій Віленкіна-Крестенсона// Радіотехніка та електроніка. -1975. -Т. 20. -№1. -С.130-138.

42. Трахтман AM, Трахтман В.А. Основи теорії дискретних сигналів кінцевих інтервалах. М: Рад. Радіо, 1975.

43. Умняшкін C.B. Алгоритм кластеризації корелюваних даних // VII Міжнародна конференція. Математика. економіка. Екологія.

44. Освіта. Міжнародний симпозіум. Ряди Фур'є та їх застосування: Тези доповідей. Ростов: Зростання. держ. економ, акад., 1999. – С. 211-212.

45. Умняшкін C.B. Алгоритм пошуку переміщених блоків для кодування цифрових відеозображень // Міжгалузевий науково-технічний журнал «Оборонний комплекс науково-технічного прогресу Росії», №3,2001.-С. 38-41.

46. ​​Умняшкін З. У. Алгоритм фрактального кодування зображень у сфері вейвлет-перетворень // Комп'ютерна математика. Оптажзарахування обчислень: Збірник наукових праць. Том 1. - Кшв: Інститут шбсрнетики ім. В.М.Глушкова, 2001. – С. 385-391.

47. Умняшкін C.B. Швидкі алгоритми обчислення дискретного мультиплікативного перетворення / М: МГІЕТ (ТУ), 1995. 15 с. - Деп. у ВІНІТІ 16.02.95, № 442-В95.

48. Умняшкін C.B. Швидкий алгоритм обчислення дискретного перетворення Крестенсона-Леві для обробки речових масивів/М.: МГІЕТ (ТУ), 1995. 19 с. - Деп. у ВІНІТІ 05.12.95, № 3212-В95.

49. Умняшкін С. В. Використання контекстного арифметичного кодування для підвищення стиснення даних за схемою JPECj // Вісті вузів. Електроніка №3. – 2001. – С. 96-98.

50. Умняшкін C.B. Компенсація переміщення об'єктів під час стиснення відеоданих // «Електроніка та інформатика XXI століття» Третя міжнародна науково-технічна конференція: Тез. док. - М: МІЕТ, 2000.-С. 365-366.

51. Умняшкін С. В. Вейвлет-компресія цифрових зображень з прогнозуванням статистичних моделей // Известия вузів. Електроніка №5. – 2001. – С.86-94.

52. Умняшкін C.B. Метод кодування дискретних зображень з урахуванням перетворення Крестенсона-Леви // Мікроелектроніка та інформатика -96: Тез. доп. міжвуз. наук.-тих. конф. М.: МДІЕТ (ТУ), 1996. - С.167.

53. Умняшкін C.B. Про кластеризацію корелюваних даних. // Інформаційні технології в інноваційних проектах. Міжнародна конференція (м. Іжевськ, 20-22 квітня 1999 р.): Матеріали доповідей. -Іжевськ, ІжДТУ, 1999. С. 59-65.

54. Умняшкін C.B. Про квантування елементів спектра дискретного перетворення Крестенсона-Леві/М.: МДІЕТ (ТУ), 1995. 12 с. - Деп. у ВІНІТІ 16.02.95, № 441-В95.

55. Умняшкін C.B. Про модифікацію дискретного косинусного перетворення // Теорія наближень та гармонійний аналіз: Тез. доп. міжнар. конф. (Тула, 26-29 травня 1998 р.). Тула: ТулДУ, 1998. – С.264-265.

56. Умняшкін C.B. Про модифікацію дискретного косинусного перетворення // Изв. Тул. держ. ун-ту. Сер. Математика. Механіка. Інформатики. Тула: ТулДУ, 1998. Т. 4. Вип. 1. С. 143-147.

57. Умняшкін C.B. Про оцінку декорелюючих властивостей дискретних перетворень // Мікроелектроніка та інформатика 97: Тези доп. міжвузівської науково-технічної конференції Частина 2. – М. МДІЕТ (ТУ), 1997.-С. 110:

58. Умняшкін C.B. Особливості використання дискретного перетворення Крестенсона-Леві для обробки речовинних масивів // Мікроелектроніка та інформатика: Тез. доп. міжвуз. наук.-тих. конф. 1214 квіт. 1995 М.: МДІЕТ (ТУ), 1995. - С. 188-189.

59. Умняшкін C.B. Оцінка ефективності використання унітарних перетворень для кодування дискретних сигналів //Інформатика та зв'язок: Зб. наук. тр. за ред. В.А.Бархоткіна. М.: МІЕТ. - 1997. С.73-78.

60. Умняшкін C.B. Застосування дискретного перетворення Крестенсона-Леві у цифровій обробці зображень. Дис. канд. техн. наук. -Москва, 1997. – 198 с.

61. Умняшкін C.B. Псевдокосинусне перетворення для стиснення дискретних сигналів // Інформаційні технології та проблеми мікроелектроніки. Зб. наук. тр. -М: МІЕТ. -1999. С.158-170.

62. Умняшкін С. В. Схема RD-оптимізованої компресії для обробки відеоданих у реальному масштабі часу// Прийнято до публікації в журнал «Известия вузів. Електроніка». №6. – 2001.

63. Умняшкін C.B. Цифрова компресія зображень з використанням дискретного перетворення Крестенсона-Леві // Міжгалузевий науково-технічний журнал «Оборонний комплекс - науково-технічний прогрес Росії», №2,2000. С.28-39.

64. Умняшкін C.B., Космач М.В. Оптимізація кодування цифрових зображень методом JPEG // Известия вузів. Електроніка №4-5. -2000. – С. 139-141.

65. Умняшкін C.B., Кочетков М.Є. Аналіз ефективності використання дискретних ортогональних перетворень для цифрового кодування корелюваних даних // Вісті ВНЗ. Електроніка №6. – 1998. – С. 79-84.

66. Умняшкін C.B., Стрєлков Ф.В., Жуков В.Г. Трикрокові алгоритми пошуку переміщених блоків зображення // Інформаційні технології та системи управління. Зб. наук. тр. за ред. В.А.Бархоткіна. - М: МІЕТ, 2000. С. 47-55.

67. Хармут X. Теорія секвентного аналізу. Основи та застосування: Пер. з англ.- М: Світ, 1980. 574 с.

68. Цифрова обробка телевізійних та комп'ютерних зображень / За ред. Ю.Б.Зубарєва та В.Пдворковича. М.: Міжнародний Центр наукової та технічної інформації, 1997. – 212 с.

69. Чен Ш.-К. Принципи проектування систем зорової інформації. -М: Світ, 1994. 408 с.

70. Ендрюс Г. Застосування обчислювальних машин для обробки зображень/Пер. з англ. за ред. Б.Ф.Кур'янова. М: Енергія. – 1977. –161 с.

71. Яворський Б.М., Детлаф А.А. Довідник з фізики для інженерів та студентів вузів.-Видання 7-е, виправлене.-М.: Наука, 1977.-944 с.

72. Ярославський JI.II. Введення у цифрову обробку зображень. М: Рад. радіо, 1979.-312 с.

73. Ярославський Л.П. Цифрова обробка сигналів в оптиці та голографії. Введення у цифрову оптику. М.: Радіо та зв'язок. – 1987. –296 с.

74. Ahmed N., Natarajan Т., Rao K.R. On image processing and discrete cosine transform // IEEE Trans. Комп'ютери. -1974. V. C-23 - №1. – P.90-93.

75. Allen J.B. andRabiner L. R. Виявлений приклад до короткого часу Fourier analysis, synthesis//Proc. IEEE 1977.-Vol. 65. -№ Ію-Р. 1558–1564.

76. Anderson J.В., Huang T.S. Piecewise Fourier перетворення на зображення bandwidth compression // IEEE Trans. Commun. -1972. - V. COM-20 №3. -P.488-491.

77. Andrews H. C., Hunt B.R. Digital Image Restoration.- Englewood Cliffs (NJ): Prentice Hall, 1977. XVIII, 238 p.

78. Andrews H. C., Pratt W.K. Fourier transform coding of images // Hawaii International Conference on System Science, January 1968. P. 677-679.

79. Andrews H.C., Pratt W.K. Transform image coding // Proc. Комп'ютер processing in communications. New York: Polytechnic Press, 1969. -P. 63-84.

80. Antonini M., BarlaudM., Mathieu P., іDaubechies I., Image coding using wavelet transform// IEEE Trans. Image Proc. Vol. 1. - №2, 1992. -P. 205-220.

81. Barnsley F., Jacquin A. Application of recurrent iterated function systems to images//Proc. SPIE.- 1988.-Vol. 1001.-P. 122-131.

82. Berger T. Rate Distortion Theory. Endlewood Cliffs, NJ: Prentice Hall, 1971.

83. Bierling M. Displacement estimation by hierarchical block-matching // Proc. SPIE Conf. On Vis. Commun. And Image Proc. Cambrige, 1988. – P. 942-951.

84. Bilgin A., Sementilli.P. і Marcellin M. Progressive image coding using trellis quantization // IEEE Trans. Image Proc. 1999.-V.8.-№11.-P. 1638–1643.

85. Chernov V.M., Dmitriyev A. G. Image Compression За допомогою дискретних ортогональних перетворень з «гойдужними» Basis Functions // Комп'ютерна оптика. 1999. – Вип. 19. – С. 184-187.

86. Cheung С.К., Ро L.M. Як hybrid adaptive search algorithm for fast block motion estimation // Proc. IEEE International Symp. on Signal Proc. and its App. (Aug.1996). Vol.1. 1996 – P.365-368.

87. Chrestenson H.E. A class of generalized Walsh functions // Pacific. J. Math. -1955.-V.5.-№l.-P. 17-32.

88. Chrysafis C. Wavelet image compression rate distortion optimizations and complexity reductions: PhD (Electrical Engineering) Thesis. University of Southern California, Los Angeles, 2000. - 144 pages.

89. Chrysafis C., Ortega A. Efficient Context-Based Entropy Coding for Lossy Wavelet Image Compression // Proc. Data Compression Conference. -Snowbird (Utah), 1997. P. 241-250.

90. З ho N., Lee S. Fast algorithm and implementation of 2-D discrete cosine transform // IEEE Trans. Circuits and Systems. 1991. -V.38. – P.297-305.

91. ChouP.A., Lookabaugh Т., GrayR.M. Entropy-constrained vector-quantization 11 IEEE Trans. ASSP. 1989. – Vol. 37. -№1. -P.31-42.

92. Coding of moving pictures and audio (MPEG-4). Стандарт ISO/IEC 14496: 1999.

93. Cohen A., Daubechies I., Feauveau J.-C., Biorthogonal bases of compactly supported wavelets // Comm. Pure Appl. Math. 1992. – V. 45. – №5. – P. 485560.

94. Coifman R., і Wickerhauser M. V., Entropy-based Algorithms для Best Basis Selection // IEEE Trans. Інформація Theory. 1992. – Vol. 38. - №2 – P. 713718.

95. Cooley J. W., Tukey J.W. На algoritm for machine computation of complex Fourier series // Mach. Comput. 1965. – V. 19. – P. 297-301.

96. Cosman P.C., GrayRM., і VetterliM. Vector Quantization of Image Subbands: A survey // IEEE Trans. Image Proc. 1996. – V. 5. – №5. – P. 202225.

97. Costantini R. та ін. A Low-Complexity Video Coder базується на Discrete Walsh Hadamard Transform //Proc. European Signal Processing Conference 2000 (Tampere, Finland, September 5-8). -2000. -P.1217-1221.

98. Crouse M. and Ramchandran K. Виконує трехholding і quantizer selection для transform image-coding: entropy-constrained analysis and applications to baseline JPEG // IEEE Trans, on Image Processing. 1997. – Vol. 6. -№2 – P. 285-297.

99. Davis G.M., A wavelet-based analysis of fractal image compression // IEEE Trans. Image Proc. 1998. – V.7-№2. -P.141-154.

100. Davis G., Nosratinia A. Wavelet-базований Image Coding: An Overview // Applied and Computational Control, Signals and Circuits. -1998. -V.l. -№1. -P. 205269.

101. Deever A. і Hemami S. What's your sign?: Efficient sign coding for embedded wavelet image coding 11 Прос.

102. Duhamel P., Guillemont C. Polynomial transform computation of 2-D DCT // Proc. ASSP "90. 1990. - P.1515-1518.

103. ЕфімовА. V. Multiplicative function systems and their applications in discrete information processing // Approximation and function spaces/ Banach center publications (Warsaw). 1989. – V.22. - P. 111-117.

104. Ефлмов В.М., Колесніков А.Н. Image compression with preliminary interpolation of the signal // Pattern Recognition and Image Analysis. 1996. – Vol. 6. - №1.

105. EliottD.F., Rao K.R. Fast transforms: algorithms, analyses, applications. -London: Academic Press inc., 1982. 488 p.

106. Enomoto II, Shibata K. Orthogonal transform coding system for television signals // IEEE Trans. Electromagnetic Compatibility. 1971. - Special issue on Walsh functions. -V. EMC-13. - №3. – P. 11-17.

107. Feig E. Fast scaled DCT algorithm // Proc. SPIE Int. Soc. Opt. Eng. 1990. -Vol. 1244.-P. 2-13.

108. Fischer TR, and WangM. Entropy-захищений трелліс кодований quantization// IEEE Trans. Inf. Theory. 1992. – Vol. 38 - №2 – P. 415-426.

109. Fisher Y. Fractal Compression: Theory and Application до Digital Images. -New York: Spinger Verlag, 1994. 341 p.

110. Good J. The interaction algorithm and practical Fourier analysis // J. Royal Stat. Soc. (London). 1958. – V. B-20. – P. 361-372.

111. Gray R.M. Vector Quantization // IEEE ASSP Magazine. -Apr. 1984. -P.4-29

112. Gray R„ Neuhoff D. Quantization // IEEE Trans. Inf. Theory. Oct. 1998. – Vol. 44.-No. 6.-P. 2325-2383.

113. HabibiA., WintzP.A. Image coding by linear transformation and block quantization//IEEE Trans. Comm. Tech. -1971. -V. COM-19. №1. -P.50-63.

114. Hamidi M., Pearl J. Comparison of cosine and Fourier transforms Markov-I signals 11 IEEE Trans. ASSP. V.24. – 1976. – P.428-429.

115. Hauque M.A. A 2-dimensional fast cosine transform // IEEE Trans. ASSP. -1985. V. 33. - №6. – P.1532-1538.

116. Huang J. Y., Schultheiss. Block quantization of correlated Gaussian random variables// IEEE Trans. Commumications. -1963. -V. CS-11 (Sept.) -P. 289296.

117. Information technology Generic coding of moving pictures and associated audio information: Video. //Recommendation ITU-T H.262. - Standard ISO/IEC 13818-2-2000.

118. ISO/IEC JTC1 Committee Draft 10918-1. Digital compression and coding of continuous-tone still images. Part 1. Requirements and guidelines. -1991.

119. ISO/IEC JTC1 Committee Draft 10918-2. Digital compression and coding of continuous-tone still images. Part 2. Compliance Testing. 1991.

120. Jacquin A. Fractal image coding спирається на теорію з iterated contractive image transformations // Proc. SPIE Visual Comm. And Image Proc. 1990. – P.227-239.

121. Jacquin A. Image coding based on fractal theory of iterated contractive image transformations // IEEE Trans. Image Proc. 1992. – Vol.1. - №1. -P. 18-30.

122. Jafarkhani H., Farvardin N., і Lee C.-C., Adaptive image coding based on the discrete wavelet transform 11 Proc. IEEE Int. Conf. Image Proc. Vol. 3-Austin (TX), 1994. - P. 343-347.

123. Jain J.R. та Jain A.K. Displacement measurement and its application in interframe image coding // IEEE Trans. Comm. 1981. – Vol. 29. - №12. -P.1799-1806.

124. JoshiR.L., Fischer T.R., і Bamberger R.H. Optimum classification in subband coding of images // Proc. IEEE Int. Conf. Image Proc. Vol. 2 – Austin (TX), 1994.-P. 883-887.

125. Joshi R.L. et al., Comparison of different methods of classification in subband coding of images// IEEE Trans. Image Processing. 1997. – Vol. 6. – Nov. – P. 1473-1486,1997.

126. JPEG2000. Part 1. Final Committee Draft Version 1.0. ISO/IEC JTC1/SC29 WG1.-205 сторінок.

127. Kasner J.H., Marcellin M. W. Adaptive wavelet coding of images // Proc. IEEE Int. Conf. Image Proc. Vol. 3 – Austin (TX), 1994. – P. 358-362.

128. Koga T. et al, Motion compensated interframe coding for video conferencing // Proceedings of the National Telecommunications Conference, New Orleans, Louisiana, Nov. 29 Dec. 3. – 1981. – Vol. 4. – P. G5.3.1-G5.3.5.

129. Kossentini F., Chung W.C., та Smith M.J.T. // IEEE Transactions on Image Processing. -1999. -Vol. 8.-№2.-P. 145-154.

130. Kurosaki M., WakiH. A JPEG-compliant colorimage compression/decompression LSI // Mitshubisi Elec. Adv. -1994. -V.68, Sept. -P.17-18.

131. Levy P. Sur une generalization des fonctions ortogonales de M. Rademacher II Comment, math. helv. 1944. – V.16. – P. 146-152.

132. Lewis AS, Knowles G. Image Compression За допомогою 2-D Wavelet Transform . II IEEE Trans. Image Proc. 1992. – Vol. 1. - №2. – P.244-250.

133. Linde Y., Buzo A., Gray R.M. An algorithm for vector quantizer design // IEEE Trans. On Comm. – 1980. – V.28. №1. - P.8 ^ 95.

134. LoPresto S.M., Ramchandran K., OrchardM.T. Image Coding базується на Mixture Modeling of Wavelet Coefficients and Fast Estimation-Quantization Framework // Proc. Data Compression Conference. Snowbird (Utah), 1997. – P. 221-230.

135. MallatS., Multiresolution aproximation and wavelet ортоnormal bases of L2(R) // Trans. AMS. 1989. – V.315. -P.69-87.

136. Marcellin M. та ail. An Overview of JPEG-2000 // Proc. Data Compression Conference, J. A. Storer andM. Cohn, eds. Snowbird, Utah, Mar. 28 березня. 30, 2000. Snowbird, 2000. – P. 523-541.

137. MarchallX. Motion estimation and compensation for very low bitrate video coding: Docteur of Sciences Appliquées. Université Catholique de Louvalin. -Louvalin-la-Neuve, 1998. - 228 pages.

138. Nasrabadi N.M., King R.A. Image coding using vector quantization: A review // IEEE Trans, on Communication. 1988. - V. 36. -No.8. – P. 957-971.

139. Nelson M., Gailly J A. The Data Compression Book (Second Edition). New York: M & T Books, 1995. - 541 p.

140. Pearl J. On coding and filtering stacionary signals by discrete Fourier transforms // IEEE Trans. Inf. Theory. 1973. – Vol. IT-19. – P. 229-232.

141. Pratt W.K, Andrews H.C. Application of Fourier-Hadamard transformation to bandwidth compression // Picture bandwidth compression / Ed.: Huang TS, Tretiak O.J. New York: Gordong and Breach, 1972. – P. 515-554.

142. Pratt W.K, Chen W.H., Welch L.R. Slant transform image coding // IEEE Trans. Commun. -1974. -V. COM-22. P.1075-1093.

143. Queluz M.P., Motion estimation for video coding: review // HF Magazine - December 1995. Special Issue on Video Coding. – No. 4. – pp. 5-28.

144. Ramachandran K, Vetteri M. Best wavelet packet bases in rate-distortion sense // IEEE Trans. Image Proc. 1993. -V.2. -№2. – P. 160-175.

145. Rao K.R., Narasimhan M.A., Reviduri K. Image data processing з Hadamard-Haar transform// IEEE Trans. Комп'ютери. 1975. – V. C-23. - №9. – P. 888-896.

146. Rao K.R., Yip P. Discrete cosine transform algorithms, advantages, applications. - London: Academic Press Inc., 1990.

147. Роска Т., Борос Т., Радванії А., Тіран П. і ChuaL.O. Detecting Moving and Standing Objects Using Cellular Neural. Networks // International Journal of Circuit Theory and Applications. Vol. 20. – 1992. – P.613-628.

148. Said A. та Pearlman W.A. Новий швидкий і ефективний image codec базується на set partitioning в hierarchical trees // IEEE Trans, on Circuits and Systems for Video Technology. 1996. – Vol. 6. - №3, June. – P. 243-250.

149. Shapiro J.M. Embedded image coding using zerotrees of wavelet coefficients 11 IEEE Trans. Signal Processing, vol. 41, pp. 3445-3462, Dec 1993.

150. Stefanoiu D. Introduction to signal processing with wavelets // Studies on Information and Control. -1994. V.3. - №1. – P. 97-110.

151. Storer J. A. Data compression: Methods and theory. Rockville (Md): Computer science press, 1988. - X, 413 p.

152. Umnyashkin S. V. Image compression ґрунтується на змішаному послідовному моделюванні wavelet trees // Reports from Vaxjo University (Sweden) Mathematics, natural sciences and technology. – Nr. 11 (September), 2001. - 18 pages

153. Umnyashkin S. V., Strelkov F. V. У RD-оптимізованих сферах для реального часу video compression // Reports from Vaxjo University (Sweden) Matematics, natural sciences and technology. – Nr. 12 (Січ), 2001. - 15 pages.

154. Van de Walle A., Merging fractal image compression and wavelet transform methods 11 Fractals. 1997. – vol. 5 (Supplementary Issue), April. - P.3-15.

155. Vetterly M., Herley C., Wavelets та Filter Banks: Theory and Design // IEEE Trans. Signal Proc. 1992. – V.40. - №9. – P.2207-2232.

156. Video codec for audiovisual services at p x 64 kbit/s. //Recommendation ITU-T H.261. -1993.

157. Video coding for low bit rate communication // Recommendation ITU-T H.263. Стандарт ISO/IEC 13818-2: 1998.

158. Wallace G.K. JPEG algoritm for image compression standard // Communications of the ACM. 1991. -V.34. -№4. – P. 30-44.356

159. WeiD., PaiH.-T., andBovikA. C., Antisymmetric Biorthogonal Coiflets для Image Coding // Proceedings IEEE International Conference on Image Processing. Chicago, 1998. – Vol. 2. – P. 282-286.

160. Witten I., Neal RM, Cleary J. G. Arithmetic coding for data compression // Comm. ACM. 1987. – Vol.30. - №6. – P. 520-540.

161. Woods J. W., Huang T.S. Picture bandwidth compression by linear transformation and block quantization // Picture bandwidth compression / Ed.: Huang TS, Tretiak O.J. -New York: Gordong and Breach, 1972. P.555-573.

162. Xiong Z., Ramchandran K. та OrchardM.T. Space-frequency Quantization for Wavelet Image Coding // IEEE Trans. Image Proc. V.6 – May 1997, P. 677693.

163. Xiong Z., Ramchandran K., і Orchard M. Wavelet пакети image coding using space-frequency quantization // IEEE Trans. Image Proc. 1998. – Vol. 7.-№6. – P. 892-898.

164. Xiong Z., Ramchandran K., Orchard M., Zhang Y.-Q. A comparative Study of DCT-і Wavelet-Based Image Coding // IEEE Trans. На Circuits and Systems for Video Technology. -1999. V.9 – №5. – P.692-695.

165. Zhang Z. and Wei V.K., на онлайн універсальної згоди з'єднання даних algoritm via continious codebook refinement. Part I. Basic results // IEEE Trans. Inform. Theory. Vol.42. – May 1996. – P.803-821.

Зверніть увагу, наведені вище наукові тексти розміщені для ознайомлення та отримані за допомогою розпізнавання оригінальних текстів дисертацій (OCR). У зв'язку з чим у них можуть бути помилки, пов'язані з недосконалістю алгоритмів розпізнавання. У PDF файлах дисертацій та авторефератів, які ми доставляємо, таких помилок немає.

Контрольна

Комунікація, зв'язок, радіоелектроніка та цифрові прилади

Алгоритми трансформування вихідних зображень на основі ортогональних перетворень З якою метою можуть використовуватися алгоритми трансформування вихідних зображень на основі ортогональних перетворень Що спільного і в чому різницю між дискретним перетворенням Фур'є та іншими видами ортогональних перетворень. Один із видів ортогональних перетворень – дискретне перетворення Фур'є. У процесі ортогональних перетворень зображення має сильні кореляційні зв'язки між сусідніми елементами.

2.4. Алгоритми трансформування вихідних зображень на основі ортогональних перетворень (З якою метою можуть використовуватися алгоритми трансформування вихідних зображень на основі ортогональних перетворень? Що спільного і в чому різницю між дискретним перетворенням Фур'є та іншими видами ортогональних перетворень?).

У деяких випадках, для скорочення обсягу даних або полегшення процедури виділення ознак об'єктів на наступних етапах розпізнавання, доцільно попередньо перетворювати вихідний двовимірний масив [Е i , j ] масив значень коефіцієнтів [ F u , v ], що має такий самий формат MxN, як і вихідне зображення.

Вторинний масив чи інакше матриця коефіцієнтів називається трансформантою. Один із видів ортогональних перетворень - дискретне перетворення Фур'є. У разі перетворення Фур'є трансформанта є нічим іншим, як двовимірним просторовим спектром зображення.

У загальному випадку будь-яке перетворення вихідного зображення на основі ортогональних операторів можна розглядати як операцію розкладання зображення в узагальнений двовимірний спектр, а коефіцієнти (тобто елементи трансформанти) як амплітуди відповідних спектральних складових. Зазначимо, що якщо при цьому як базові функції використовуються негармонічні функції, то поняття просторової частоти слід узагальнити і використовувати поняття секвенти.

Секвентою називається величина, що дорівнює половині середнього числа перетинів нуля в одиницю часу або на одиницю довжини.

У процесі ортогональних перетворень зображення, що має сильні кореляційні зв'язки між сусідніми елементами відбувається декореляція (відбілювання). Таким чином, значення елементів трансформантів виявляються практично некорельованими. На відміну від вихідного масиву, для якого характерно в середньому рівномірний розподіл енергії сигналу між елементами, розподіл енергії сигналу трансформанті вкрай нерівномірно. Основна частка енергії посідає елементи з малими порядковими номерами(тобто на низькі просторові секвенти) і лише невелика частка на інші (див. рис 2. 3).

Мал. 2. 3. Розподіл енергії сигналу між окремими елементами
у вихідному масиві (а) та у трансформанті (б).

Ця обставина дозволяє або взагалі відкинути (тобто вважати рівними нулю) більшу частину елементів трансформанти (що означає, по суті, низькочастотну просторову фільтрацію), або квантувати їх на малу кількість рівнів з використанням мінімальної кількості розрядів двійкового коду.

Розглянемо деякі найпоширеніші види ортогональних перетворень, що застосовуються під час цифрової обробки зображень.

Тут коефіцієнти F u у загальному випадку є комплексними числами

Дискретне перетворення Фур'є

Кожен комплексний коефіцієнт можна замінити двома дійсними складовими. Ці складові характеризують, відповідно, просторові дискретні спектри амплітуд та фаз і визначаються таким чином:

Основний недолік дискретного перетворення Фур'є порівняно великий обсяг обчислень, а також необхідність збереження великої кількості складових трансформантів у порівнянні з іншими ортогональними перетвореннями при однакових помилках відновлення зображення (тобто при однакових втратах інформації). Крім того, для зберігання окремих складових комплексних коефіцієнтів потрібно більший обсяг пам'яті, ніж для дійсних значень елементів вихідного масиву. Говорячи про дискретне перетворення Фур'є, слід згадати про можливість застосування спеціально розроблених алгоритмівшвидкого перетворення Фур'є, а також про спеціалізовані обчислювальні пристрої для їх реалізації так званихсистолічних процесорах.

Перетворення Уолша(при M = N)

У свою чергу, коефіцієнти b k (Z) визначаються так: b k (Z ) дорівнює значенню k -Того розряду двійкового коду числа Z , що складається з l двійкових розрядів. Якщо, наприклад, Z = 10, тобто. 10 10 = 1010 2 то
b 0 = 0; b 1 = 1; b 2 = 0; b3 = 1.

b k визначаються відповідно до правила їх визначення у перетворенні Уолша.

Перетворення Адамара(при M = N)

Очевидно, що всі види ортогональних перетворень є оборотними, тобто, використовуючи процедуру зворотного перетворення, можна з трансформантів відновити вихідне зображення.

Нехай [Е i , j ] масив вихідного зображення форматом NxN , де j номер рядка, i номер стовпця елементів (номер елементів у рядку); [ F u , v ] трансформанта зображення, яка має той самий формат NxN , де u та v відповідно номер рядка та номер стовпця елементів трансформантів. Тоді, загалом, незалежно від виду ортогонального перетворення, запишемо

де a (i, j, u, v) і b (i, j, u, v) базисні функції прямого та зворотного перетворень відповідно.

З практичної погляду важливо відзначити, що це розглянуті вище види ортогональних перетворень є роздільними по змінним. Таким чином, обчислення прямих та зворотних двовимірних ортогональних перетворень вдається звести до послідовного виконання одновимірних перетворень

Тут астр (i, u), b (i, u) і a (j, v), b (j, v) базисні функції прямого та зворотного перетворень, відповідно вздовж напрямку рядків і стовпців.

Для зручності запису та обчислень доцільно використовувати матричний апарат

Тут [А е ] і [ А стор ] ¦ матриці прямого перетворення; [В е] і [В стор ] ¦ матриці зворотного перетворення; [Астр ] т і [В стр ] т матриці, отримані в результаті транспонування матриць [А стор] та [В стор].

Зрозуміло, незалежно від форми математичного уявлення, пряме і зворотне ортогональні перетворення двовимірних масивів вимагають, у випадку, значних обчислювальних витрат. Це слід враховувати під час проектування

АТСН, що працюють у реальному масштабі часу. Однак, при цифровій обробці бінарних зображень процедури ортогональних перетворень істотно спрощуються, особливо у разі використання бінарних базисних функцій (перетворення Уолша, Адамара та ін.).


А також інші роботи, які можуть Вас зацікавити

72688. РОЗРОБКА ЕКСПЕРТНОЇ СИСТЕМИ З ЗАСТОСУВАННЯМ РЕЛЯЦІЙНОГО ПІДХОДУ СУБД ACCESS І З ВИКОРИСТАННЯМ ЗАСОБІВ VISUAL PROLOG 2.09 MB
Систему, яку маємо намір побудувати ми, належить до класу ідентифікаційних (або діагностичних) систем. Системи цього вирішують завдання визначення, тобто. ідентифікації об'єкта за його ознаками.
72690. ЛАБОРАТОРНА ДІАГНОСТИКА ПОРУШЕНЬ ГЕМОСТАЗУ 10.55 MB
Оцінка стану системи згортання крові одна з найскладніших діагностичних завдань. У цьому посібнику це питання розглядається з різних точок зору: загальних біологічних закономірностей функціонування багатокомпонентних систем патофізіологічних механізмів організму.
72692. Перевірка рівня сформованості основних навичок роботи з електронними таблицями 104 KB
Права частина служить для переміщення по таблиці вправо вліво а ліва частина що містить ярлички листів дозволяє переміщатися між листами. Створення таблиці Створіть заготівлі таблиці самостійно застосовуючи наступні операції: запуск Excel; форматування рядка заголовка
72693. Дослідження мультивібратора на напівпровідникових транзисторах. 2.58 MB
Відповідно параметри транзисторів повинні бути повністю ідентичні. І така ідеальна схема буде непрацездатною: обидва транзистори будуть відкриті. Неможливість реально забезпечити абсолютну симетрію та наявність позитивного зворотного зв'язку призводять до того, що після подачі напруги живлення...
72696. Знайомство з можливостями баз даних Excel 103 KB
Уявіть собі власником маленького магазину. Необхідно вести постійний облік приходу та витрат товарів, щодня мати перед очима реальний залишок, мати можливість роздрукувати найменування товарів по відділах і т.д. Допомогти цьому може Excel.

Одними з найбільш поширених засобів обробки як одновимірних, так і багатовимірних сигналів, у тому числі зображень, є ортогональні перетворення. Особливо велика роль ортогональних перетворень у вирішенні задачі зменшення швидкості передачі двійкових символів у цифровому телебаченні і, отже, зменшенні необхідної лінії частот каналів зв'язку. Сутність ортогональних перетворень полягає у поданні вихідного сигналу як суми ортогональних базисних функцій.

Нагадаємо, що функції x(t) і y(t) називаються ортогональними на відрізку (t 1 , t 2), якщо їх скалярний добуток дорівнює нулю

Це визначення може бути поширене на дискретні сигнали, що подаються послідовностями чисел. Дискретні сигнали х(п) і у(п), що мають N відліків, називаються ортогональними, якщо виконується умова

Одним з найбільш відомих прикладів застосування ортогонального перетворення є розкладання періодичного сигналу х до ряду Фур'є

де: ; Т – період повторення сигналу x(t).

Дійсні коефіцієнти ряду Фур'є визначаються співвідношеннями

У комплексній формі розкладання до ряду Фур'є має вигляд:

Комплексні амплітуди гармонік;

j - уявна одиниця.

У ряд Фур'є може бути розкладений як періодичний сигнал, має період Т, а й сигнал, відмінний від 0 лише з інтервалі часу (-T/2, Т/2). І тут використовується періодичне продовження сигналу протягом усього вісь часу з періодом Т.

Розглянемо дискретний сигнал х(п), відмінний від 0 за п = 0,1, …, N-1. Для такого сигналу також можна ввести розкладання базису синусоїдальних функцій. Так як частотний спектр сигналу, що дискретизується повинен бути обмежений зверху відповідно до умови теореми Котельникова, в розкладанні дискретного сигналу залишається кінцеве число частотних складових, що являють собою дискретні комплексні гармонічні функції. Таке розкладання, що називається дискретним перетворенням Фур'є (ДПФ), має вигляд

N = 0, 1 ... N-1, (2.6)

де коефіцієнти ДПФ X(k) визначаються співвідношенням

K = 0, 1 ... N-1, (2.7)

Нагадаємо, що знаходження коефіцієнтів Х(k) по (2.7) зазвичай називають прямим ДПФ, а отримання сигналу за цими коефіцієнтами відповідно (2.6) - зворотним ДПФ.

У цих співвідношеннях замість інтегралів з'явилися суми, оскільки вихідний сигнал не є безперервним, а дискретним. Частоті, що використовується в розкладанні аналогових сигналів і має розмірність рад/с, ДПФ відповідає безрозмірна величина, де k=0, 1…N-1. Відношення показує, яку частину частоти дискретизації становить частота дискретної гармоніки.

Коефіцієнти ДПФ Х(k) та експоненційні множники (2.6), (2.7) є комплексними числами. Кожне комплексне число запам'ятовується у цифровому ЗУ у вигляді пари дійсних чисел, що становлять його дійсну та уявну частини. Додавання двох комплексних чисел вимагає виконання двох операцій складання дійсних чисел - окремо складаються дійсні та уявні частини. Множення двох комплексних чисел вимагає виконання чотирьох операцій множення та двох операцій складання дійсних чисел. Таким чином, виконання ДПФ у комплексній формі призводить до суттєвого збільшення необхідного обсягу ЗП та часу обчислень.

Щоб мати справу тільки з дійсними числами, зазвичай використовують розкладання за допомогою дискретного косинусного перетворення (ДКП), що описується співвідношенням:

де коефіцієнти ДКП визначаються за формулами

Як і у випадку ДПФ, знаходження коефіцієнтів C(k) (2.9) називається прямим ДКП, а подання сигналу у вигляді (2.8) називається зворотним ДКП.

Аналогічно можна записати співвідношення для прямого та зворотного ДПФ та ДКП у двовимірному випадку. Двовимірний дискретний сигнал, наприклад, окремий кадр цифрового телевізійного сигналу, представляється матрицею значень х(т,п), де т = 0... М-1 – номер відліку у рядку, п = 0.., N-1 – номер рядка в кадрі.

Пряме двовимірне ДПФ має вигляд:

k=0…M-1, l=0…N-1,

де X(k,l) – комплексні коефіцієнти ДПФ, що відображають просторово-частотний спектр зображення.

Зворотне двовимірне ДПФ представляє розкладання зображення за базовими функціями:

Коефіцієнти двовимірного прямого ДКП визначаються за формулами:

Зворотне двовимірне ДКП має вигляд:

Величини і є дискретними просторовими частотами, горизонтальною і вертикальною координатами, відповідно, які виражаються безрозмірними величинами, що мають такий же зміст, як і дискретна частота в одновимірному випадку. Кожна дискретна просторова частота пропорційна відношенню просторового періоду дискретизації даної координати до просторового періоду цієї частотної складової. Просторові періоди у своїй вимірюються в одиницях відстані.

На рис. 2.3 показані як напівтонових картинок базисні функції двовимірного ДКП для М = 8, N = 8. Світлі ділянки відповідають позитивним значенням, а темні - негативним.

Мал. 2.3.

Наведено приклади:

  • а) k = 1, l = 0; б) k = 0; l = 1; в) k = 1; l = 1;
  • г) k = 0; l = 2; д) k = 1, l = 2; е) k = 2, l = 2;
  • ж) k = 4; l = 2; з) k = 7; l = 1; і) k = 7; l = 7.

Чудовою властивістю розкладання відеосигналу в базисі ДКП є те, що кожна базова функція містить інформацію про все зображення відразу. Число базисних функцій, що використовуються для розкладання відеосигналу, визначає точність представлення зображення.

Відповідно до , в цілому можна оцінити витрати обчислювальних ресурсів при виконанні прямого та зворотного ДПФ, як пропорційні N 2 . Аналогічно можна показати, що обчислення двовимірних прямого та зворотного ДПФ вимагає виконання кількості операцій, пропорційної N 2 М 2 .

Наприклад, обчислення ДПФ для квадратного блоку зображення, що містить 8x8 елементів (пікселів), вимагатиме виконання приблизно 16·10 3 операцій множення та додавання. А обчислення ДПФ чорно-білого телевізійного кадру звичайного стандарту розкладання, що містить 720x576 пікселів, вимагатиме виконання близько 8 · 10 11 операцій. Якщо обчислення виробляються на комп'ютері, що виконує 10 6 операцій над дійсними числами в секунду, час обчислення ДПФ становитиме 8 · 10 5 с або більше 200 год. необхідно шукати шляхи скорочення кількості необхідних операцій.

Найбільш радикальний спосіб зменшення обсягу обчислень полягає у застосуванні відкритих у 60-ті роки швидких алгоритмів ДПФ, які називають алгоритмами швидкого перетворення Фур'є (БПФ). Детально швидкі алгоритми обчислення ДПФ описані у багатьох літературних джерелах і не розглядаються.

Двовимірне БПФ може бути розкладене на послідовність одновимірних. Число необхідних операцій виявляється пропорційним. Для наведеного вище прикладу телевізійного кадру, що складається з 720x576 пікселів, це значення виявляється рівним приблизно 8 · 106, що в 105 разів менше, ніж кількість операцій, необхідне для безпосереднього обчислення ДПФ.

Існують також швидкі алгоритми обчислення ДКП. Як видно з подальшого, у цифровому телебаченні головну роль грає ДКП блоків 8x8 пікселів, при виконанні якого використовується алгоритм швидкого обчислення одновимірного ДКП відрізка цифрового сигналу, що містить вісім елементів. При цьому спочатку обчислюються ДКП для кожного стовпця блоку елементів зображення, а потім отриманої матриці 8x8 чисел обчислюються ДКП для кожного рядка.

У сучасній апаратурі, в тому числі і для цифрового телебачення, ДПФ і ДКП, як правило, виконуються в реальному часі із застосуванням цифрових процесорів обробки сигналів (ЦПОС) або спеціальних апаратних засобів, наприклад паралельних обчислювальних пристроїв.

ДКП лежить в основі методів кодування JPEG, MPEG-1, MPEG-2, що найбільш широко використовуються в даний час, опис яких буде дано в п. 2.2.

Перетворення, які використовуються для стиснення зображень, повинні бути швидкими і, по можливості, легко реалізованими на комп'ютері. Це передусім передбачає, що такі перетворення мають бути лінійними.Тобто перетворені величини С(є лінійними комбінаціями (сумами з деякими множниками чи вагами) вихідних величин (пікселів) dj,причому відповідним множником або вагою служить деяке число Wij(Коефіцієнт перетворення). Значить, С( -]Г\- djWij,де г, j= 1,2,..., п.Наприклад, при п= 4 це перетворення можна записати в матричній формі, яка в загальному випадку набуде наступного вигляду: С = W D. Кожен вектор-стовпець матриці W називається «базисним вектором».

Важливим завданням є визначення коефіцієнтів перетворення wij.Основна вимога полягає в тому, щоб після перетворення величина с\була б великою, проте інші величини С2,сз,... стали б малими. Основне співвідношення С(= Ylj djWijприпускає, що С(буде більшим, якщо ваги Wijпосилюватимуть відповідні величини dj.Це станеться, наприклад, якщо компоненти векторів wijі djмають близькі значення та однакові знаки. Навпаки, С(буде малим, якщо ваги будуть малими, і половина з них матиме знак, протилежний знаку відповідного числа dj.Тому, якщо виходять великі с*, то вектори W(jмають схожість із вихідним вектором dj, а малі С(означають, що компоненти wijсильно відрізняються від dj.Отже, базисні вектори wijможна інтерпретувати як інструмент для отримання деяких характерних ознак вихідного вектора.

На практиці ваги Wijне повинні залежати від вихідних даних. Інакше їх доведеться додавати в стислий файл для використання декодером. Це міркування, і навіть те що, що вихідні дані є пікселами, тобто, неотрицательными величинами, визначає спосіб вибору базисних векторів. Перший вектор, який породжує с\,повинен складатися з близьких, можливо, чисел, що збігаються. Він посилюватиме невід'ємні величини пікселів. А решта векторів базису повинні наполовину складатися з позитивних чисел, а на іншу половину - з негативних. Після множення на позитивні величини та їх складання результат буде малим числом. (Це особливо вірно, коли вихідні дані близькі, а ми знаємо, що сусідні пікселі мають, зазвичай, близькі величини.) Нагадаємо, що базисні вектори є деяким інструментом для отримання особливостей вихідних даних. Тому хорошим вибором будуть базисні вектори, які сильно відрізняються один від одного і тому можуть отримувати різні особливості. Це призводить до думки, що базисні вектори мають бути взаємно ортогональними.Якщо матриця перетворення W складається з ортогональних векторів, то перетворення називається ортогональним.Інше спостереження, що дозволяє правильно вибирати базисні вектори, полягає в тому, що ці вектори повинні мати все більші частоти зміни знака, щоб видобувати, так би мовити, високочастотні характеристики даних, що стискуються при обчисленні перетворених величин.

Перший базовий вектор (верхній рядок W) складається з одних одиниць, тому його частота дорівнює нулю. Всі інші вектори мають дві +1 і дві -1, тому вони дадуть невеликі перетворені величини, які частоти (виміряні кількістю змін знаків у рядку) зростають. Ця матриця подібна до матриці перетворення Адамара-Уолша (див. рівняння (3.11)). Наприклад, перетворимо початковий вектор (4,6,5,2)

Результат цілком підбадьорливий, оскільки число с\стало більшим (порівняно з вихідними даними), а два інших числа стали малими. Обчислимо енергії вихідних та перетворених даних. Початкова енергія дорівнює 4 2 + б 2 + 5 2 + 2 2 = 81, а після перетворення енергія стала 17 2 + З 2 + (-5) 2 + I 2 - 324, що вчетверо більше. Енергію можна зберегти, якщо помножити матрицю перетворення W коефіцієнт 1/2. Новий твір W-(4,6,5,2) т дорівнюватиме (17/2,3/2, -5/2,1/2). Отже, енергія зберігається і концентрується у першій компоненті, і вона тепер становить 8.5 2 /81 = 89% загальної енергії вихідних даних, у яких першої компоненти припадало лише 20%.

Інша перевага матриці W полягає в тому, що вона робить зворотне перетворення. Вихідні дані (4,6,5,2) відновлюються за допомогою твору W-(17/2,3/2, -5/2,1/2).

Тепер ми можемо оцінити переваги цього перетворення. Квантуємо перетворений вектор (8.5,1.5,-2.5,0.5) за допомогою його округлення до цілого та отримуємо (9,1,-3,0). Робимо зворотне перетворення та отримуємо вектор (3.5,6.5,5.5,2.5). В аналогічному експерименті ми просто видалимо два найменші числа і отримаємо (8. 5,0, -2.5,0), а потім зробимо зворотне перетворення цього грубо квантованого вектора. Це призводить до відновлених даних (3,5.5,5.5,3), які дуже близькі до вихідних. Отже, наш висновок: навіть це просте та інтуїтивне перетворення є гарним інструментом для «вичавлювання» надмірності з вихідних даних. Більш витончені перетворення дають результати, які дозволяють відновлювати дані з високим ступенем схожості навіть при грубому квантуванні.



Останні матеріали розділу:

Тест: Чи є у вас сила волі?
Тест: Чи є у вас сила волі?

Ви й самі знаєте, що із силою волі у Вас проблеми. Часом, буваєте, неврівноважені та нестабільні в емоційних проявах, але, незважаючи на це,...

Повна біографія джона гриндера
Повна біографія джона гриндера

Здобув класичну освіту в школі єзуїтів. Джон Гріндер закінчив психологічний факультет Університету Сан Франциско на початку 60-х і...

Микола II: видатні досягнення та перемоги
Микола II: видатні досягнення та перемоги

Останній імператор Росії увійшов до історії як негативний персонаж. Його критика не завжди зважена, але завжди яскрава. Дехто називає його...