Научная статья на тему 'Нейроэволюционный способ улучшения визуального качества изображений'

Нейроэволюционный способ улучшения визуального качества изображений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
804
115
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
улучшение качества изображений / оценка качества изображений / нейроэволюционный подход

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Цой Юрий Робертович, Спицын Владимир Григорьевич

Рассматривается улучшение визуального качества изображений с использованием нейроэволюционного подхода. Представлена формула для оценки визуального качества изображений, а также формулы для быстрого вычисления приближенных локальных среднего и дисперсии изображения, позволяющие уменьшить вычислительную сложность процедуры вычисления на порядок при сохранении приемлемой точности. Описан трехэтапный способ улучшения изображений, приведено сравнение результатов его работы с результатами известных методов, показавшее эффективность предлагаемого подхода.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Improving visual image quality using neuroevolutionary approach has been examined. Formulas for estimating image visual quality as well as formulas for fast computing approximate local average and dispersion of image allowing decreasing computational complexity of calculation procedure and keeping acceptable accuracy are given. Three-stage method of improving images is described the results of its work are compared with the results of known methods it shows the efficiency of the proposed approach.

Текст научной работы на тему «Нейроэволюционный способ улучшения визуального качества изображений»

СПИСОК ЛИТЕРАТУРЫ

1. Abdou I.E., Pratt W.K. Quantitative Design and Evalution of Enhacement/Thresholding Edge Detectors // Proc. IEEE. - 1979. -V. 67. - P. 753-763.

2. Ramesh V., Haralick R.M., Performance Characterization of Edge Detectors // SPIE Applications of Artificial Intelligence X: Machine Vision and Robotics. - 1992. - V. 1. - P. 252-266.

3. Jiang X.Y., Hoover A., Jean-Baptiste G., Goldgof D., Bowyer K., Bunke H. A methodology for Evaluating Edge Detection Techniques for Range Images // Proc. ASIAN Conf. Computer Vision. -1995. - P. 415-419.

4. Kanungo T, Jaisimha M.Y., Palmer J., Haralick R.M. A Methodology for Quantitative Performance Evaluation of Detection Algo-

rithms // IEEE Trans. Image Processing. - 1995. - V. 4. -P. 1667-1674.

5. Лаевский В.Е. Алгоритм построения одноуровневых марковских полей // Известия Томского политехнического университета. - 2006. - Т. 309. - № 8. - С. 32-36.

6. Буймов А.Г., Ильин С.П. Мозаичное изображение с управляемой корреляцией // Автометрия. - 1987. - № 5. - С. 30-35.

7. Сергеев В.В., Сойфер В.А. Имитационная модель изображения и метод сжатия данных. Обработка изображений в автоматизированных системах научных исследований. - М.: Наука, 1978. - С. 76-78.

Поступила 21.04.2009г.

УДК 004.932; 004.8

НЕЙРОЭВОЛЮЦИОННЫЙ СПОСОБ УЛУЧШЕНИЯ ВИЗУАЛЬНОГО КАЧЕСТВА ИЗОБРАЖЕНИЙ

Ю.Р. Цой, В.Г. Спицын

Томский политехнический университет E-mail: yurytsoy@gmail.com

Рассматривается улучшение визуального качества изображений с использованием нейроэволюционного подхода. Представлена формула для оценки визуального качества изображений, а также формулы для быстрого вычисления приближенных локальных среднего и дисперсии изображения, позволяющие уменьшить вычислительную сложность процедуры вычисления на порядок при сохранении приемлемой точности. Описан трехэтапный способ улучшения изображений, приведено сравнение результатов его работы с результатами известных методов, показавшее эффективность предлагаемого подхода.

Ключевые слова:

Улучшение качества изображений, оценка качества изображений, нейроэволюционный подход.

Обработка изображений является сложной задачей ввиду проблемы объективной оценки качества изображений, вычислительных затрат и др. Из-за огромного количества практических областей и, следовательно, разнообразия требований, предъявляемых к качеству изображений, основная цель: создание универсального алгоритма, либо подхода к улучшению качества изображений, -представляется недостижимой. Данный факт является одним из основных мотивов для исследователей к созданию новых способов обработки изображений. К настоящему времени предложено множество подходов к улучшению качества изображений [1-3]. Некоторые из них весьма просты (например, гамма-коррекция [1]), в то время как другие достаточно сложны (к примеру, алгоритм Multi-Scale Re-tinex [3], использующий модель цветовосприятия человека [4]).

В общем случае проблема попиксельной обработки изображений может быть представлена в виде проблемы поиска следующей функции (или ее параметров):

I * = T (I, Q), (1)

где Iи I* - интенсивность пикселей до и после обработки соответственно; Q - вектор параметров, определяющих локальные и/или глобальные ха-

рактеристики каждого пикселя обрабатываемого изображения.

В данной статье предлагается способ улучшения качества изображений посредством аппроксимации функции Т на основании ее некоторых общих свойств. Функция Т аппроксимируется с помощью искусственных нейронных сетей (ИНС), которые обучаются с использованием эволюционного алгоритма (нейроэволюционный (НЭ) подход

[5]) для попиксельной обработки изображений.

Общие положения рассматриваемого способа

нейросетевой обработки изображений

Будем рассматривать локально-адаптивный подход к обработке изображений. Особенность подхода заключается в независимой обработке каждого пикселя, исходя из имеющегося набора его локальных и глобальных характеристик (например, локальная и глобальная средняя интенсивность)

[6]. Будем использовать ИНС для попиксельной обработки яркостной составляющей изображений.

В отличие от известных подходов, где изображение поступает для обработки на вход ИНС «целиком» (неокогнитрон [7], сети Хопфилда [8] и др.), в предлагаемом способе обработки изображений ИНС обучается обработке одного пикселя. Таким

образом, уменьшаются требования к объему оперативной памяти, необходимой для хранения информации об ИНС. При этом появляется возможность обрабатывать изображения произвольных размеров.

Будем рассматривать преобразование (1) в виде:

(2)

L (х, y) = T(L(x, y), D,

( x, У ):

m,

(x, У )

L (x,y) = T (m( y), D{

'(x,y) ;

(3)

(x y) = LrfX,:y Zi(x> У)> L( x y)

(4)

Будем использовать следующую функцию /mo¿ оценки визуального качества изображения:

fmod

MN -п 256 - exp(H) 255 - E /77

MN

192

255

(5)

где Х*(х;у) и Х(х;у) - соответственно обработанное и исходное значение яркости пикселя (х;у), ш(ху) и - соответственно средняя яркость и дисперсия яркости в окрестности обрабатываемого пикселя. Таким образом, для преобразования (2) ИНС, аппроксимирующая функцию Т, должна иметь 3 входа и 1 выход.

Поскольку субъективная природа человеческого восприятия затрудняет оценку визуального качества изображения, при обработке изображений всегда имеется неопределенность, вызванная непредсказуемостью реакции наблюдателя. Кроме этого, часто различные изображения должны быть обработаны по-разному с учетом контекстной информации. Поэтому выбранных локальных характеристик (яркость и ее статистические характеристики) может быть недостаточно для обработки изображения. Данные соображения ведут к заключению, что обученная ИНС «должна знать», как обрабатывать изображения в некотором абстрактном общем случае. В силу приведенных рассуждений будем обучать ИНС аппроксимации функции Т*, несколько отличной от функции Т, представленной выражением (2):

где <L> - средняя яркость на всем изображении (глобальная средняя яркость). Таким образом, ИНС обучается работать с усредненными параметрами вместо точных.

При обработке цветных изображений, производится преобразование в цветовое пространство Lab [1], затем осуществляется обработка компоненты L с использованием ИНС, а после этого информация о цвете восстанавливается в соответствии:

где Z*(x;y) и Z(x;y) - соответственно восстановленная после обработки и исходная г-е цветовые компоненты пикселя с координатами (х;у). Поскольку при восприятии цвета основную роль играет соотношение между цветовыми компонентами [1], то преобразование (4) не изменяет цвет пикселя, меняется только его насыщенность.

Оценка функционирования ИНС

Оценка качества изображения играет ключевую роль в обучении ИНС, т.к. от нее непосредственно зависит результат НС обработки изображений. В настоящее время отсутствует общепринятый подход к оценке качества изображений, поэтому разные авторы используют различные оценки в зависимости от поставленных задач.

где Е - суммарная интенсивность пикселей на контурах на изображении, - количество пикселей на контурах; N и М - соответственно ширина и высота изображения; #=-£ /1п/;, /■ - доля пикселей с г-м уровнем яркости. Коэффициенты в выражении (5) подобраны экспериментальным путем.

Сравнение [9] предлагаемой оценки/шоА с оценкой Мунтеану-Роса [10] показало значимо большую корреляцию с известными оценками качества /ш и /да [11] для набора из 246 изображений.

Таким образом, качество обработанного изображения оценивается в зависимости от двух достаточно общих факторов:

1. Общее количество и характеристики пикселей на контурах на изображении.

2. Распределение различных уровней яркости на изображении.

Оценивание функционирования ИНС осуществляется по последовательности M*N ее выходных сигналов. Формула (5) представляет довольно грубую оценку качества изображения, так как в ней рассматривается только контрастность и распределение яркости обработанного изображения. Однако, как будет показано далее, такой подход достаточен для эволюционной настройки структуры и весов ИНС. Отметим, что возможно обучение ИНС на наборе изображений. В этом случае оценка каждой ИНС вычисляется как средняя оценка обработанных изображений. После обучения полученная ИНС может быть использована для обработки изображений, отсутствовавших в обучающей выборке. Таким образом, сохраняется «классическая» методология обучения ИНС. Данное свойство позволяет сократить время обработки изображений из-за отсутствия необходимости в обучении ИНС обработке каждого нового изображения.

Трехэтапная обработка

Анализ получаемых НС решений [12] и практические исследования показали необходимость использования пред- и постобработки изображений. В результате проведенного исследования, для предварительной обработки была выбрана эвристическая мультипликативная подстройка яркости исходного изображения:

Ь = аЬ„,

а =

97

L"> <97'

1, 97 <(L0) < 157,

Л<L0> > l57'

(6)

где матрицы Ь0 и Ь описывают распределение яркости на изображении соответственно до и после предобработки, <Ь0> - средняя яркость исходного изображения. Границы 97 и 157 выбраны по результатам экспериментов.

Согласно преобразованию (1) ИНС обрабатывает пиксели с использованием локальных характеристик, поэтому для более эффективной обработки представляется разумным применение, в качестве алгоритма для следующего этапа обработки, «глобального» алгоритма улучшения качества изображений. Для этой цели предлагается использовать алгоритм автоматической настройки уровней яркости, реализованный во многих графических пакетах, и заслуживший признание, благодаря своему качеству и скорости работы. Согласно этому алгоритму, каждый цветовой канал изображения обрабатывается отдельно и интенсивность ^ обработанного пикселя определяется по следующей формуле:

0,

< К

z »- b0

255 — —, bo < Zj < b„

b1 - bo

255,

z jj > к

где b0 и b1 — соответственно нижняя и верхняя границы «отсечения» по гистограмме яркости, такие что:

к 255

b0 = max к: ^ r < 0,005, bj = min c: ^ r < 0,005,

i=0 i=c

где r; - доля пикселей на исходном изображении с г-м уровнем интенсивности, и, очевидно, Zr=1. Границы b0 и b1 вычисляются отдельно для каждого канала.

Таким образом, предлагаемый способ трехэтапной обработки включает в себя следующие этапы:

1. Предобработка изображений с помощью подстройки яркости (6).

2. Обработка на локальном уровне с использованием ИНС.

3. Глобальная обработка с применением алгоритма автонастройки уровней.

Преобразование яркости, соответствующее предлагаемому трехэтапному способу обработки, можно схематично представить следующим образом:

L0 —— L —— L* ——■ Lj,

где L1 описывает распределение яркости на обработанном изображении, полученное после третьего этапа, а символ —— обозначает применение k-го этапа обработки.

Приближенное вычисление локальных характеристик

В соответствии с предлагаемым подходом, применение обученных ИНС подразумевает использование локальных средней и дисперсии яркости (2), поэтому время обработки изображений существен-

но зависит от скорости вычисления этих характеристик. С увеличением размера окрестности вычислительная сложность также увеличивается, так как увеличивается количество обрабатываемых пикселей.

Для вычисления локальных средней и дисперсии яркости в прямоугольной окрестности будем использовать следующие формулы:

_ т(*)(Л) + т(у)(ХК + (

т,

D( X, у) = '

3

D( x)( Ул) + D( у)( XJ

2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(7)

где уле [г1;г2], хКе ;/2] - координаты пикселя из рассматриваемой окрестности.

Отметим, что таким образом удалось уменьшить вычислительную сложность вычислений локальных характеристик с 0(и2) до О(и). Дополнительное исследование [13] показало, что для набора искусственных и реальных изображений соотношение сигнал-шум при использовании формул (7) составляет от 20 дБ и выше для приближенного среднего, и от 30 дБ и выше для приближенной дисперсии, что вполне удовлетворительно, принимая во внимание рассуждения об отсутствии необходимости в обработке точных значений локальных характеристик ввиду субъективной природы человеческого восприятия и большого разнообразия изображений. Использование приближенных формул позволяет ускорить вычисления более чем в 30 раз для окрестности размером 65x65 пикселей.

Описание экспериментов

Напомним, что в соответствии с локальноадаптивным подходом к обработке изображений рассматривается нейросетевая аппроксимация преобразования (2):

L (X, у) = T(L(X, у), D,

( X, у )■

т

(X ,у )

Для уменьшения неопределенности, возникающей при обработке изображений, будем обучать ИНС аппроксимации преобразования:

L (X, у) = T (т(X,у), D(

где характеристики т^ и Б(ху) вычисляются точно для окрестности 3x3, имеющей наименьший радиус, что позволяет ускорить процесс обучения.

Для подсчета числа пикселей на границах областей различной яркости, необходимого для оценивания (5) изображения, обработанного ИНС, будем использовать ускоренный вариант детектора края Собеля, описанный в [14]. Поскольку выражение (5) дает приближенную оценку качества изображения, то нет необходимости минимизировать его до 0. В результате экспериментов установлено, что приемлемые результаты обработки достигаются, как правило, при значениях целевой функции /, лежащих в диапазоне [2,4; 2,85]. При меньших значениях / обработанные изображения становятся

слишком контрастными с потерей деталей в светлых и темных областях, а при больших /получаются изображения со слабым контрастом. В качестве критерия останова будем использовать /0 = 2,5.

Длительность эволюционного поиска составляет не более 25 поколений.

Для обучения ИНС будем использовать изображение, показанное на рис. 1. Размер изображения выбран небольшим, чтобы повысить скорость обучения, и равен 128x128 пикселей.

ре AMD Athlon X2 4800, работающего на частоте 2600 МГц. Примеры изображений, полученных с использованием трехэтапной обработки, и сравнение с алгоритмом автонастройки уровней яркости и Multi-Scale Retinex (MSR) представлены на рис. 3 и 4. Заметим, что использование ИНС, отличной от показанной на рис. 2, скорее всего, даст другие результаты обработки ввиду различий реализуемого отображения «вход ^ выход».

Рис. 1. Изображение, использованное для обучения ИНС. Черная рамка вокруг изображения добавлена специально для облегчения визуального восприятия

Результаты экспериментов

Время обучения составило около 60 с. Структура полученной ИНС представлена на рис. 2.

Скорость обработки изображений с использованием предлагаемого трехэтапного способа для окрестности 11x11 пикселей составляет около 1,7 мегапикселей/с при вычислениях на процессо-

Рис. 2. Структура ИНС, полученной в результате эволюционного обучения с использованием изображения, представленного на рис. 1

Результаты трехэтапной обработки сравнивались с результатами работы алгоритмов Multi-Scale Retinex (MSR) [3] и известным алгоритмом автонастройки уровней [1]. Будем производить сравнение по следующим показателям:

1. Качество обработки.

2. Сохранение информации исходного изображения. Сравнение качества обработки осуществляется

следующим образом. Пусть A - исходное изображение и BUSR, ВШо и BANN - обработанные изображения, полученные с использованием соответствен-

Рис. 3. Пример результата обработки изображения (а) с использованием предлагаемого трехэтапного способа обработки (г) и сравнение с использованием только алгоритма автонастройки уровней яркости (б) и обработкой алгоритмом MSR (в)

Рис. 4. Пример результата обработки изображения (а) с использованием предлагаемого трехэтапного способа обработки (г) и сравнение с использованием только алгоритма автонастройки уровней яркости (б) и обработкой алгоритмом MSR (в)

но MSR, алгоритма автонастройки уровней и предлагаемой трехэтапной обработки. Для каждого из изображений BtfSS, Вш1о и BANN вычисляются значения визуальных оценок качества fVIF [11], Мунтеа-ну-Роса [10] и fod (5). После этого в соответствии со значениями каждой из оценок определяются ранги изображений, причем ранг 1 присваивается изображению с наилучшим качеством, а ранг 3 - изображению с наихудшим качеством.

Таким образом, для обработанного изображения определяется набор из 3 рангов, по одному для каждой оценки. В результате обработки различных исходных изображений в соответствии со значениями используемых оценок качества подсчитывается сумма рангов для сравниваемых алгоритмов обработки изображений, и чем меньше сумма рангов алгоритма, тем лучше этот алгоритм обрабатывает изображения. Значения сумм рангов сравниваемых алгоритмов для набора из 53 исходных изображений приведены в табл. 1.

По приведенным в табл. 1 данным видно, что по всем используемым оценкам визуального качества изображений алгоритм MSR обладает наилучшими показателями, а алгоритм автонастройки уровней является наихудшим среди рассматриваемых. Предлагаемый трехэтапный способ обработки уступает алгоритму MSR, но превосходит алгоритм автонастройки уровней.

Таблица 1. Значения суммы рангов для алгоритмов обработки изображений по используемым оценкам визуального качества

Алгоритм Сумма рангов

По оценке frVIF По оценке fMR По оценке fmod Общая

MSR 59 75 100 234

Автонастройка уровней 157 149 116 422

Трехэтапная обработка 102 94 102 298

Анализ сохранения информации исходного изображения рассматриваемыми алгоритмами необходим для того, чтобы оценить насколько сравниваемые алгоритмы искажают в процессе обработки исходное изображение. Для этого будем использовать меру SSIM - Structure SIMilarity index [15], в которой сравнение двух изображений, исходного и измененного, производится на основе сравнения следующих компонент:

1. Распределение яркости.

2. Изменение контрастов.

3. Структурная информация.

Первые две компоненты характеризуют особенности человеческого восприятия изображения, а третья компонента необходима для учета пространственных зависимостей между соседними пикселями. Отмечено, что мера SSIM хорошо коррелирует с субъективными оценками и превосхо-

дит многие существующие подходы к оценке различия двух изображений [15].

Для оценки рассматриваемых алгоритмов MSR, автонастройки уровней и трехэтапной обработки с точки зрения сохранения информации исходного изображения также была проведена серия экспериментов и вычислены ранги для использованного ранее набора из 53 исходных изображений. Значения сумм рангов приведены в табл. 2. Видно, что, как и в случае оценки улучшения визуального качества изображений, алгоритм MSR показывает наилучший результат, алгоритм автонастройки уровней уступает всем алгоритмам, а способ трехэтапной обработки занимает «промежуточную» позицию.

Таблица 2. Значения суммы рангов по мере SSIM

Алгоритм Сумма рангов по мере SSIM

MSR 75

Автонастройка уровней 140

Трехэтапная обработка 104

Таким образом, по качеству обработки и по сохранению информации исходного изображения предлагаемый способ трехэтапной обработки превосходит алгоритм автонастройки уровней, но уступает алгоритму MSR. Отметим, что алгоритм MSR является вычислительно сложным [16], поскольку в нем используется преобразование Фурье и независимая обработка каждой цветовой плоскости при этом каждый пиксель обрабатывается с учетом окрестностей 3 радиусов, равных 15, 80 и 250 пикселей [3].

Заключение

Показано, что использование эволюционирующих нейронных сетей с достаточно грубой оценкой качества их функционирования представляет эффективный способ получения нейросетевого реше-

СПИСОК ЛИТЕРАТУРЫ

1. Gonzalez R.C., Woods R.E. Digital image processing. - Reading MA: Addison-Wesley, 2001. - 813 p.

2. Jahne B. Digital Image Processing. - Berlin: Springer-Verlag, 2002.

- 585 p.

3. Woodell G.A., Jobson D.J., Rahman Z., Hines G.D. Enhancement of imagery in poor visibility conditions // Sensors, and Command, Control, Communications, and Intelligence (C3I) Technologies for Homeland Security and Homeland Defense IV. Proc. SPIE 5778. -Orlando, FL, USA, 28 March 2005. - SPIE Society of Photo-Optical Instrumentation Engi, 2008. - P. 673-683.

4. Land E. Recent advances in retinex theory // Vision Research. -1986. - V. 26. - №1. - P. 7-21.

5. Цой Ю.Р. Введение в нейроэволюционный подход: основные концепции и приложения // Научная сессия МИФИ-2007. IX Все-росс. научно-техн. конф. «Нейроинформатика-2007»: Лекции по нейроинформатике. Ч. 2. - М.: МиФи, 2007. - С. 43-76.

6. Журавель И.М. Краткий курс теории обработки изображений [Электронный ресурс]. - Режим доступа: http://matlab.ex-ponenta.ru/imageprocess/book2/index.php. - 24.12.2008.

ния для быстрой и эффективной попиксельной обработки изображений.

Представлены формулы для приближенного вычисления локальных характеристик (среднее и дисперсия) изображения, позволяющие быстро вычислять локальные характеристики в прямоугольной окрестности с приемлемой точностью (более 20 дБ для среднего и более 30 дБ для дисперсии [13]). Использование полученных формул позволяет существенно повысить скорость нейросетевой обработки изображений по локально-адаптивному методу по сравнению с использованием точных формул (свыше 30 раз для окрестности 65х65 пикселей).

Предложен трехэтапный способ улучшения качества изображений включающий в себя следующие этапы: (1) предобработка яркости исходного изображения; (2) обработка на локальном уровне с использованием ИНС; (3) обработка на глобальном уровне с применением известного алгоритма автонастройки уровней яркости.

Результаты экспериментов показали высокую эффективность и качество предложенного трехэтапного способа обработки изображений по сравнению с рядом известных методов. Сравнение результатов разработанного способа трехэтапной нейросетевой обработки изображений с используемой в NASA технологией Multi-Scale Retinex (MSR) показало сопоставимость результатов при небольшом превосходстве MSR, однако скорость обработки с использованием предлагаемого способа выше за счет использования приближенных формул для вычисления локальных характеристик (среднее и дисперсия) с использованием окрестности меньшего размера и отказа от использования преобразования Фурье.

Работа выполнена при финансовой поддержке гранта РФФИ № 09-08-00309-а.

7. Fukushima K., Miyake S. Neocognitron: A new algorithm for pattern recognition tolerant of deformations and shifts in position // Pattern Recognition. - 1982. - V. 15. - № 6. - P. 455-469.

8. Hopfield J.J. Neural networks and physical systems with emergent collective computational abilities // Proc. Natl. Acad. Sci. USA. -1982. - V. 79. - № 8. - P. 2554-2558.

9. Цой Ю.Р. Нейроэволюционный алгоритм и программные средства для обработки изображений: Автореф. дис. ... к.т.н.: 05.13.01. - Томск, 2007. - 20 с.

10. Munteanu C., Rosa A. Gray-scale image enhancement as an automatic process driven by evolution // IEEE Trans. on Systems, Man and Cybernetics. - Part B: Cybernetics. - 2004. - V. 34. - № 2. -P. 1292-1298.

11. Sheikh H.R., Bovik A.C., De Veciana G. An Information Fidelity Criterion for Image Quality Assessment Using Natural Scene Statistics // IEEE Transactions on Image Processing. - May 2005. -P. 2117-2128.

12. Цой Ю.Р., Спицын В.Г, Чернявский А.В. Способ улучшения качества монохромных и цветных изображений, основанный на применении эволюционирующей нейронной сети // Информационные технологии. - 2006. - № 7. - С. 27-33.

13. Цой Ю.Р. Приближенное вычисление локальных среднего и дисперсии для обработки цифровых изображений // Информационные технологии. - 2007. - № 4. - С. 28-32.

14. Линдли К. Практическая обработка изображений на языке Си.

- М.: Мир, 1996. - 512 с.

15. Wang Z., Bovik A.C., Sheikh H.R., Simoncelli E.P. Image quality assessment: From error visibility to structural similarity // IEEE

Transactions on Image Processing. - 2004. - V. 13. - № 4. -P. 600-612.

16. Elad M., Kimmel R., Shaked D., Keshet R. Reduced complexity Retinex algorithm via the variational approach // J. Vis. Commun. Image R. - 2003. - № 14. - P. 369-388.

Поступила 22.04.2009г.

УДК 004.5:004.657

ИНТЕЛЛЕКТУАЛИЗАЦИЯ ИНТЕРФЕЙСА БАЗЫ ДАННЫХ

О.М. Акимов, В.А. Шапцев

Тюменский государственный университет E-mail: akimov-oleg@ya.ru

Рассматривается задача об автоматическом преобразовании запроса к базам данных, сформулированного на естественном языке, в стандартный запрос на языке СУБД. В статье предлагается алгоритм, реализованный на базе концептуальных графов. Интерфейс интерпретирует естественно-язычный запрос и представляет его в виде концептуального графа. Этот граф модифицируется затем информацией из базы знаний о предметной области и структуре базы данных. Результирующий граф становится основой формирования SQL-запроса.

Ключевые слова:

Естественный язык, базы данных, концептуальные графы, естественно-языковой интерфейс.

Введение

За время существования информационные системы и Мегий накопили огромные массивы данных, большая часть которых представлена на естественном языке, в частности, - русском. Поэтому все актуальнее становится проблема работы с компьютером и его содержимым на естественном языке. При этом разрабатываются различные методы и технологии: от извлечения различных данных, имен, фактов, построения вопросно-ответных систем, до резюмирования текстов, позволяющего просматривать и обрабатывать массивы документов, недоступные в обычной работе пользователя.

Наиболее распространенным источником информации являются существующие и вновь создаваемые базы данных (БД). А усиливающаяся тенденция предоставления доступа к БД посредством web-сервисов Интернета делают вопрос быстрого и полного поиска информации одним из актуальных в современных информационных технологиях. Особенно остро этот вопрос стоит для слоя пользователей, не являющихся специалистами в области информационных технологий, составляющие большинство современных пользователей Интернета, которые также чаще всего:

• даже не специалисты в предметной области

приложения или web-ресурса;

• не знают языка запросов SQL;

• не располагают структурой базы данных;

• редко используют расширенный поиск приложения или web-сервиса, предпочитая использовать быстрый поиск по одному-двум словам.

Соответственно такой поиск часто не дает полные и необходимые пользователю результаты. Естественный язык (ЕЯ) в данном контексте - предпочтительный способ общения человека с компьютером. Пользователя информационной системы чаще всего интересует не функционал и возможности интерфейса, а информация необходимая ему.

Узким местом в разработке компьютерных систем, понимающих естественный язык, является получение адекватных по сути и объему знаний о предметной области. Эта проблема менее сложна при создании приложений, ориентированных на использование БД. Несмотря на то, что БД обычно содержат гигантские объемы информации, она (информация) посредством модели данных имеет достаточно регулярную структуру, с одной стороны, и связана с узкой предметной областью, с другой. Более того, семантика БД четко определена.

Подход к пониманию естественного языка

Основная задача естественно-языкового интерфейса (ЕЯ-интерфейса): перевести запрос на естественном языке в стандартный запрос на языке СУБД. Но этот перевод невозможно совершить напрямую, т. к. слова и даже целые выражения естественного языка обычно имеют несколько смыслов и требуют дополнительной интерпретации. Поэто-

i Надоели баннеры? Вы всегда можете отключить рекламу.