Научная статья на тему 'Исследование вариантов реализации этапа предсказания лифтинговой схемы при решении задачи сжатия звука'

Исследование вариантов реализации этапа предсказания лифтинговой схемы при решении задачи сжатия звука Текст научной статьи по специальности «Автоматика. Вычислительная техника»

CC BY
96
33
Поделиться
Ключевые слова
ЛИФТИНГ / LIFTING / ЛИФТИНГОВАЯ СХЕМА / LIFTING SCHEME / ЭТАП ПРЕДСКАЗАНИЯ / PREDICTION STAGE / ВЕЙВЛЕТ / WAVELET / СЖАТИЕ ЗВУКА / AUDIO SIGNAL / АУДИОСИГНАЛ / SOUND COMPRESSION

Аннотация научной статьи по автоматике и вычислительной технике, автор научной работы — Пиуновский Евгений Витальевич

Проведено сравнение различных реализаций этапа предсказания лифтинговой схемы вейвлет-преобразования на основе трех различных функций: Хаара, линейной и полиномиальной. В качестве анализируемых данных выбраны аудиосигнал и финансовый временной ряд. Представлены лифтинговая схема и краткое описание ее основных этапов. Выполнен анализ результатов различных вариантов предсказания и приведена их количественная оценка. Сделаны выводы о влиянии сложности функции на результат предсказания различных типов сигналов.

Похожие темы научных работ по автоматике и вычислительной технике , автор научной работы — Пиуновский Евгений Витальевич,

Variants research of lifting scheme prediction stage realization when solving the sound compression task

Comparison of different realizations for wavelet transform lifting scheme prediction stage on the basis of three different functions: Haar's, linear and polynomial is carried out. An audio signal and financial time series are chosen as the analyzed data. The lifting scheme and the concise description of its main stages are presented. The results of different prediction variants are analyzed and their quantitative assessment is given. The conclusions about the function complexity influence on different types of signals prediction results are made.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Текст научной работы на тему «Исследование вариантов реализации этапа предсказания лифтинговой схемы при решении задачи сжатия звука»

ИССЛЕДОВАНИЕ ВАРИАНТОВ РЕАЛИЗАЦИИ ЭТАПА ПРЕДСКАЗАНИЯ ЛИФТИНГОВОЙ ...

Литература

1. Твердотельная революция в телевидении / В.В. Березин, А.А. Умбиталиев, Ш.С. Фахми, А.К. Цыцу-лин, Н.Н. Шипилов. - М.: Радио и связь, 2006. - 300 с.

2. Александров В.В., Горский И.Д. Представление и обработка изображений. Рекурсивный подход. - Л.: Наука, 1985. - 192 с.

3. Demaret L., Iske A. Adaptive image approximation by linear splines over locally optimal Delaunay triangulations // IEEE Signal Processing Letters. - 2006. - № 13 (5). - Р. 281-284.

4. Demaret L., Dyn N. and A. Iske. Image compression by linear splines over adaptive triangulations // Signal Processing. - 2006. - № 86 (7). - Р. 1604-1616.

5. Demaret L., Iske A. Anisotropic triangulation methods in image approximation. In: Approximation Algorithms for Complex Systems. E.H. Georgoulis, A. Iske and J. Levesley (ete). - Berlin: Springer, 2010. - Р. 47-68.

6. Фахми Ш.С. Кодирование и декодирование видеоинформации // Вопросы радиоэлектроники. Сер. Техника телевидения. - 2007. - Вып. 2. - С. 43-51.

7. Прапарата Ф., Шеймос М. Вычислительная геометрия: Введение. - М.: Мир, 1989. - 478 с.

8. Фахми Ш.С. Полигональная рекурсивная обработка видеоинформации // Вопросы радиоэлектроники. Сер. Техника телевидения. - 2008. - Вып. 1. - С. 42-51.

9. Фахми Ш.С. Аналитическая модель оценки степени приближения к эпсилон-энтропии на основе пирамидально-рекурсивного метода кодирования изображений // Вестник ТОГУ. - 2010. - № 1 (16). -С. 32-44.

Колесников Евгений Игоревич - Санкт-Петербургский государственный университет информационных

технологий, механики и оптики, аспирант, evgeniy777.84@gmail.com Костикова Елена Валентиновна - Санкт-Петербургский государственный университет водных коммуни-

каций, преподаватель, Kostikovaev@mail.ru

УДК 004.627

ИССЛЕДОВАНИЕ ВАРИАНТОВ РЕАЛИЗАЦИИ ЭТАПА ПРЕДСКАЗАНИЯ ЛИФТИНГОВОЙ СХЕМЫ ПРИ РЕШЕНИИ ЗАДАЧИ СЖАТИЯ ЗВУКА

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Е.В. Пиуновский

Проведено сравнение различных реализаций этапа предсказания лифтинговой схемы вейвлет-преобразования на основе трех различных функций: Хаара, линейной и полиномиальной. В качестве анализируемых данных выбраны аудиосигнал и финансовый временной ряд. Представлены лифтинговая схема и краткое описание ее основных этапов. Выполнен анализ результатов различных вариантов предсказания и приведена их количественная оценка. Сделаны выводы о влиянии сложности функции на результат предсказания различных типов сигналов. Ключевые слова: лифтинг, лифтинговая схема, этап предсказания, вейвлет, сжатие звука, аудиосигнал.

Введение

В настоящее время работа с мультимедийной информацией, подлежащей передаче по телекоммуникационным сетям, является активно развивающейся областью цифровой обработки сигналов [1]. Одно из важнейших мест в указанной области часто отводят задаче сжатия аудиоданных, которые могут как являться составной частью передаваемого видеотрафика, так и представлять собой отдельный цифровой поток. Для успешного решения данной задачи требуется применение новых технологий, одной из которых является вейвлет-преобразование (ВП), изучавшееся многими исследователями в последние годы. Рассмотрение различных источников позволяет предположить, что в настоящий момент наиболее перспективным методом построения вейвлет-функций является лифтинговая схема [2-4].

Для исследования возможности применения лифтинговой схемы ВП при решении задачи сжатия звука необходимо практическое рассмотрение различных вариантов реализации ее основного этапа, называемого этапом предсказания. Для выбора предпочтительного варианта из рассмотренных требуется как краткое описание технологий, используемых в каждой реализации этапа предсказания, так и графическое или числовое сравнение практических результатов.

На данный момент существуют примеры подобных исследований, проведенных на основе алгоритмов, реализация которых наиболее подробно описана в источнике [4]. Но, с точки зрения автора, сделанные в них выводы нельзя считать общими, так как соответствующие опыты проводились над ограниченными наборами данных определенного типа. В работе рассматриваются два различных вида исходного сигнала, а также функции различной сложности, что позволяет не просто проанализировать полученные результаты, но и осуществить их сравнение.

Постановка задачи

Лифтинговая схема использует подобие низкочастотных и высокочастотных компонент, что позволяет резко ускорить преобразование и снизить количество используемых в схеме операций, обеспечивает простой и интуитивно понятный алгоритм обратного преобразования, а также дает некоторые другие преимущества [2, 3]. Лифтинг может быть представлен в виде трех основных этапов (рис. 1).

5

нечетн.

Рис. 1. Лифтинговая схема ВП

На первом из них осуществляется разбиение (S, split) сигнала по одному из правил, например, на четные и нечетные отсчеты (вейвлет Лэйзи) или на полусуммы и полуразности (вейвлет Хаара). Далее происходит предсказание (Р, prediction) неизвестных отсчетов и разница между предсказанным и исходным значениями присваивается вейвлет-коэффициенту. На последнем этапе происходит обновление (U, update) оставленных отсчетов с помощью соседних вейвлет-коэффициентов, которое позволяет сохранить среднее, осуществить сглаживание (smoothing) функции. В результате получаем грубое представление исходного сигнала (5) следующего уровня разложения (/-1) и набор детальной информации (d) [3].

Второй этап (этап предсказания) является основным и оказывает наибольшее влияние на результаты применения построенной лифтинговой схемы для решения поставленных задач. При его реализации можно выделить и исследовать следующие три вида функций предсказания [5]:

1. функцию (вейвлет) Хаара;

2. линейную функцию;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. полиномиальную функцию.

Реализация алгоритмов данных функций и исследование возможностей предсказания с их помощью на отрезке аудиосигнала позволяют выделить лучший вариант исполнения этапа предсказания для звука. Сравнение полученных результатов с опытом предсказания сигнала другого вида помогает показать особенности звука, которые упрощают (или, наоборот, усложняют) процесс предсказания. В связи с этим в работе осуществлялось последовательное применение функций различной сложности к наборам данных двух типов - звукового сигнала и финансового временного ряда (т.е. колебания курса валют или биржевых котировок).

Описание исследования

Как было указано выше, для исследования были выбраны два типа сигналов, представленные одномерными массивами данных, каждый из которых состоял из 64 чисел. Аудиоданные были извлечены из музыкального файла (пробной, свободно распространяемой композиции, загруженной из сети Интернет) в формате ИКМ (PCM - Pulse Code Modulation) с частотой дискретизации 44,1 кГц, глубиной кодирования 16 бит и битрейтом 705 кбит/с (моно, 1 канал). Финансовый временной ряд был сформирован на основе изменений цен на нефть за определенный период. К данным массивам применялись различные алгоритмы предсказания на основе функций, перечисленных ранее; полученные результаты анализировались и сравнивались между собой.

Сначала рассматривалось предсказание сигналов с помощью функции (вейвлета) Хаара, которая представляет собой простейший сигнал данного вида и часто используется в теоретических материалах и практических исследованиях для иллюстрации свойств вейвлетов. Это позволило показать влияние степени сложности функции (начиная с простейшего вейвлета Хаара) на результаты предсказания в зависимости от вида анализируемого сигнала. Следует отметить, что во время реализации данного этапа наглядно проявились основные преимущества лифтинговой схемы, описываемые в литературе [2-5]:

- быстрое вычисление (за счет снижения количества операций);

- отсутствие необходимости в дополнительной памяти (in-place computation): при реализации алгоритма не пришлось использовать дополнительных (буферных) переменных);

- простота получения обратного преобразования.

Сам же алгоритм предсказания заключается в копировании значения каждого четного отсчета на место последующего нечетного (отсчеты нумеруются с нуля; предсказываются всегда нечетные отсчеты), что,

ИССЛЕДОВАНИЕ ВАРИАНТОВ РЕАЛИЗАЦИИ ЭТАПА ПРЕДСКАЗАНИЯ ЛИФТИНГОВОЙ

фактически, является вычислением степени постоянства функции. В результате предсказания был получен грубый вариант исходной функции как для звукового сигнала, так и для временного ряда, отличающийся резкими перепадами, не свойственными первому набору данных. В числовом выражении погрешность предсказания (вычисленная как математическое ожидание соотношения разницы между исходным сигналом и предсказанным из интервала значений сигнала в процентах) оказалась равной 2,43% для аудиосигнала и еще большей (3,23%) для финансового ряда. Таким образом, применение функции Хаара для предсказания обоих видов данных показало, что, как и можно было предполагать, самый простой вейвлет приводит к высокой погрешности, постоянно отклоняясь от исходного сигнала.

При использовании линейной функции предсказания каждый нечетный отсчет вычисляется как полусумма окружающих его четных отсчетов, что приводит к вычислению степени отклонения сигнала от линейности на рассматриваемых отрезках (так называемой кусочной линейности). В результате подобного предсказания получено достаточно точное повторение исходного звукового сигнала (с заметными ошибками лишь в местах его резкого перепада) и снова грубое представление временного ряда. В цифрах это выразилось как средние ошибки, равные 0,62% и 3,23% для аудиосигнала и финансового ряда соответственно. Как видно, применение более сложной функции позволило значительно улучшить результат предсказания функции первого типа, но никак не повлияло на точность для данных второго типа.

Наиболее точного предсказания удалось добиться с помощью полиномиальной функции, основанной на формуле интерполяционного многочлена Лагранжа и представляющей так называемую кубическую интерполяцию, т.е. предсказание каждого нечетного отсчета на основе четырех ближайших с предыдущего уровня разложения. Для наглядности результат предсказания с помощью данной функции для аудиосигнала был представлен в графическом виде (рис. 2).

60

40

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Я О

о «

к

я у

а я со

20

-20

-40

-60

1

11

21

31

41

51

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

61

Номера отсчетов

Рис. 2. Предсказание аудиосигнала с помощью полиномиальной функции: сплошная линия - исходный

сигнал, пунктир - предсказанный сигнал

0

Вид функции предсказания Хаара Линейная Полиномиальная

Аудиосигнал Минимальная погрешность (дБ) 0 0 0

Максимальная 10,71 1,8 0,69

погрешность (дБ)

Минимальная

Финансовый погрешность (ШБ/баррель) 0 0 0

временной ряд Максимальная

погрешность (ШБ/баррель) 7,31 5 5,06

Таблица. Диапазон абсолютных значений погрешности предсказания

Из рис. 2 видно, что существенная (и заметная на данном разрешении) погрешность для последовательности аудиоотсчетов была допущена лишь на некоторых перепадах и границе конечного сигнала; она

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

составила 0,23%, а в случае с финансовым рядом полиномиальная функция даже уступила своим менее сложным альтернативам, что выразилось в увеличении средней ошибки до 3,85%. Крайние абсолютные значения ошибки для обоих видов сигнала (и трех функций предсказания) представлены в таблице.

Анализ результатов

Подводя итоги, удобно представить колебания погрешности предсказания для различных исходных и анализирующих функций в виде диаграмм (рис. 3, 4).

Ошибка предсказания при анализе аудиосигнала

12

о4 10

S

W

ю s 8

S

о 6

я

(D F 4

я

И

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ГО

2

0

11 21 Номера нечетных (подлежащих предсказанию) отсчетов

Рис. 3. Погрешность предсказания аудиосигнала с помощью различных функций: - функция Хаара; - линейная функция; - полиномиальная функция

Ошибка предсказания при анализе временного ряда

11 21 Номера нечетных (подлежащих предсказанию) отсчетов

Рис. 4. Погрешность предсказания финансового ряда с помощью различных функций: - функция Хаара; - линейная функция; - полиномиальная функция

Изучив представленные изображения, можно отметить, что финансовый временной ряд - значительно более трудная для предсказания функция, чем аудиосигнал. В связи с этим на результаты ее анализа не влияет сложность используемой функции предсказания, что и подтверждалось исследованиями других авторов [4, 5]. Более гладкое и плавное представление набора аудиоотсчетов, наоборот, можно предсказать с гораздо большей точностью (рис. 3), увеличивая сложность предсказывающей функции (что проявляется в резко различающемся заполнении диаграммы для разных инструментов анализа).

Кроме того, необходимо подчеркнуть, что на практике подтвердилась и основная проблема функций предсказания для конечного сигнала, описываемая в [3, 5], - резкое возрастание погрешности на его (сигнала) границе. Особенно отчетливо данная особенность проявилась для сложных (линейной и полиномиальной) функций.

Заключение

Выделенные и проверенные в исследовании преимущества лифтинговой схемы подтверждают, что на данный момент она является одним из основных и наиболее удобных инструментов построения вейвлет-функций, пригодных для решения задачи сжатия звука.

МОДЕЛИРОВАНИЕ РАБОТЫ ПСЕВДО-СЕТЕВОЙ ВЕРСИИ БАЗЫ ДАННЫХ .

Данные, полученные при реализации второго этапа лифтинга на основе трех различных функций предсказания, позволили показать их отклонения от исходного сигнала в графической форме и оценить их точность при сравнении средней погрешности. Красноречивым оказался анализ результатов, полученных по описанной общей схеме, для различных видов исходной функции - последовательности аудио отсчетов и финансового временного ряда. Явно проявилась зависимость влияния сложности функции предсказания на его результат от вида анализируемого сигнала. Среди рассмотренных вариантов реализации этапа предсказания лифтинговой схемы наиболее точных результатов при анализе аудиосигнала достигла полиномиальная функция. Показанная ею точность свидетельствует о том, что данный вид функций является наиболее многообещающим при решении задачи предсказания нестационарного сигнала такого вида, как звук, в лифтинговой схеме.

Сделанные в работе выводы также позволяют утверждать, что наиболее перспективными направлениями дальнейших исследований являются, во-первых, реализация этапа предсказания лифтинговой схемы на базе других функций (полиномов), во-вторых, поиск решения проблемы предсказания на границах конечных сигналов.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Литература

1. Радзишевский А.Ю. Основы аналогового и цифрового звука. - М.: Вильямс, 2006. - 288 с.

2. Воробьев В.И., Грибунин В.Г. Теория и практика вейвлет-преобразования. - СПб: ВУС, 1999. - 208 с.

3. Sweldens W., Schröder P. Building Your Own Wavelets at Home. - CA: SIGGRAPH, 1996. - 76 p.

4. Jensen A., La Cour-Harbo A. Ripples in Mathematics: The Discrete Wavelet Transform. - NY: Springer, 2001. - 257 p.

5. Fournier A. et al. Wavelets and Their Applications in Computer Graphics. - CA: SIGGRAPH, 1995. -239 p.

Пиуновский Евгений Витальевич - Санкт-Петербургский государственный университет информационных

технологий, механики и оптики, аспирант, evgpiun@gmail.com

УДК 004.021:004.045:004.67:004.622

МОДЕЛИРОВАНИЕ РАБОТЫ ПСЕВДО-СЕТЕВОЙ ВЕРСИИ БАЗЫ ДАННЫХ В MS ACCESS НА ПРИМЕРЕ ОТДЕЛА ПРОДАЖ

МАЛОГО ПРЕДПРИЯТИЯ С.П. Макаров, Т.А. Бороненко, А.Г. Коробейников (публикуется в порядке дискуссии)

Рассмотрена проблематика и особенности сетевых баз в Access в соответствии со спецификой предметной области. Предлагается архитектура для построения базы данных. Смоделирована миграция данных по всем узлам построенной модели псевдо-сетевой версии базы данных. Проанализирована динамика модели. На примере отдела продаж малого предприятия показана эффективность разработанной модели.

Ключевые слова: моделирование, сетевые базы данных, сетевая архитектура, MS Access, архитектура файл-сервер, AllFusion Process Modeller, нотация IDEF0.

Введение

Специфика экономических процессов в наше время заставляет малые предприятия искать более простые и удобные решения обработки, анализа и хранения финансово-экономических данных. Это ниша программного обеспечения, управляющего базами данных (БД). В данный момент наиболее доступным и простым решением является использование СУБД Microsoft© Access 2003 (в дальнейшем MS Access). Один из основных плюсов разработки на MS Access - плотная связь с Microsoft Office. Для работы созданного приложения достаточно установить Microsoft Office (в дальнейшем - «Офис»). При этом устанавливаются все необходимые для работы MS Access библиотеки, драйверы работы с базами данных (ODBC, OLEDB, MS ADO и т.д.). Кроме того, MS Access во многом совместим с СУБД Microsoft SQL Server и другими форматами баз данных [1].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Проблематика и особенности сетевых баз в Access

К сожалению, MS Access имеет существенный минус - в нем отсутствует возможность реализации полноценной сетевой версии СУБД «клиент-сервер». MS Access не имеет собственной серверной компоненты, но в этом продукте реализована возможность применить технологию ADO, которая имеет поддержку локальных СУБД различных типов [1]. Таким образом, проблему отсутствия возможности реализации полноценной сетевой версии БД «клиент-сервер» можно решить путем создания псевдосетевой версии БД.