Научная статья на тему 'Реконструкция функций и цифровых изображений по их знаковым представлениям'

Реконструкция функций и цифровых изображений по их знаковым представлениям Текст научной статьи по специальности «Математика»

CC BY
132
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Компьютерная оптика
Scopus
ВАК
RSCI
ESCI
Область наук
Ключевые слова
ПАРНЫЕ СРАВНЕНИЯ / ЗНАКОВОЕ ПРЕДСТАВЛЕНИЕ / ФУНКЦИЯ ПОЛЕЗНОСТИ / ФУНКЦИЯ ПРЕДПОЧТЕНИЯ / ВЫЯВЛЕНИЕ ПРЕДПОЧТЕНИЙ / ПРИНЯТИЕ РЕШЕНИЙ / МАШИННОЕ ОБУЧЕНИЕ / ЦИФРОВОЕ ИЗОБРАЖЕНИЕ / PAIRWISE COMPARISONS / SIGN REPRESENTATION / UTILITY FUNCTION / PREFERENCE FUNCTION / PREFERENCES ELICITATION / DECISION MAKING / MACHINE LEARNING / DIGITAL IMAGE

Аннотация научной статьи по математике, автор научной работы — Мясников Владислав Валерьевич

В работе рассматриваются вопросы реконструкции неявно заданных функций или цифровых изображений. Функции задаются с использованием наблюдений, каждое из которых представляет собой результат парного сравнения значений функции для двух случайных аргументов. Представлен анализ современного состояния исследований для частных постановок указанной проблемы: метода парных сравнений, используемого при принятии решений в случае конечного множества альтернатив; реконструкции предпочтений пользователей в многокритериальных задачах анализа; знаковых представлений изображений, используемых в качестве аппарата описания и анализа цифровых изображений. Предлагается унифицированный подход к реконструкции функций и изображений по их знаковым представлениям, основанный на переходе в пространство высокой размерности и построения линейного (для случая реконструкции функции и изображений) или нелинейного (в т.ч. непараметрического) классификатора (для реконструкции предпочтений). Для ряда алгоритмов классификации проведены экспериментальные исследования по оценке эффективности предложенного подхода на примере задачи реконструкции функции полезности в теории принятия решений и реконструкции функции яркости реальных изображений.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Мясников Владислав Валерьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Reconstruction of functions and digital images using sign representations

The paper deals with the reconstruction of implicitly defined functions or digital images. Functions are defined using observations, each of which is the result of a pairwise comparison of the function values for two random arguments. The analysis of the current state of research for particular statements of this problem is presented: the method of pairwise comparisons used in decision-making for a finite set of alternatives; reconstruction of preference/utility function in multicriteria tasks; sign representations of images used for the description and analysis of digital images. A unified approach to reconstructing functions and images according to their sign representations is proposed, based on mapping in a highdimensional space and constructing a linear (when reconstructing a function and images) or non-linear (including non-parametric) classifier (when reconstructing preferences). For a number of classification algorithms, experimental studies have been conducted to evaluate the effectiveness of the proposed approach using the example of the reconstruction of the utility function in problems of decision theory and reconstruction of the brightness function of real images.

Текст научной работы на тему «Реконструкция функций и цифровых изображений по их знаковым представлениям»

Реконструкция функций и цифровых изображений по их знаковым представлениям

В.В. Мясников1,2

1 Самарский национальный исследовательский университет имени академика С.П. Королёва, 443086, Россия, г. Самара, Московское шоссе, д. 34, 2 ИСОИ РАН - филиал ФНИЦ «Кристаллография и фотоника» РАН, 443001, Россия, г. Самара, ул. Молодогвардейская, д. 151

Аннотация

В работе рассматриваются вопросы реконструкции неявно заданных функций или цифровых изображений. Функции задаются с использованием наблюдений, каждое из которых представляет собой результат парного сравнения значений функции для двух случайных аргументов. Представлен анализ современного состояния исследований для частных постановок указанной проблемы: метода парных сравнений, используемого при принятии решений в случае конечного множества альтернатив; реконструкции предпочтений пользователей в многокритериальных задачах анализа; знаковых представлений изображений, используемых в качестве аппарата описания и анализа цифровых изображений. Предлагается унифицированный подход к реконструкции функций и изображений по их знаковым представлениям, основанный на переходе в пространство высокой размерности и построения линейного (для случая реконструкции функции и изображений) или нелинейного (в т.ч. непараметрического) классификатора (для реконструкции предпочтений). Для ряда алгоритмов классификации проведены экспериментальные исследования по оценке эффективности предложенного подхода на примере задачи реконструкции функции полезности в теории принятия решений и реконструкции функции яркости реальных изображений.

Ключевые слова: парные сравнения, знаковое представление, функция полезности, функция предпочтения, выявление предпочтений, принятие решений, машинное обучение, цифровое изображение.

Цитирование: Мясников, В.В. Реконструкция функций и цифровых изображений по их знаковым представлениям / В.В. Мясников // Компьютерная оптика. - 2019. - Т. 43, № 6. -С. 1041-1052. - БО!: 10.18287/2412-6179-2019-43-6-1041-1052.

Введение

Методы машинного обучения и принятия решений находят всё более широкое применение в различных областях современной цифровой экономики. Разрабатываемые научными группами для решения конкретных задач, некоторые методы и алгоритмы оказываются совершенно неожиданно востребованными в других или смежных научных направлениях, вызывая синергетический эффект повсеместно. Настоящая работа посвящена одному достаточно узкому, на первый взгляд, вопросу, связанному с оценкой эффективности реконструкции функций и/или цифровых изображений по их знаковому представлению. Истоки данной задачи, отличающейся использованием не абсолютных значений функций, а результатов парных сравнений их значений, появились в работах по цифровой обработке сигналов и изображений в 90-х и были связаны с вопросами текстурного описания изображений (работа D.C. He и L. Wang [1], 1990 г.) и анализа цифровых сигналов (российские работы О.В. Цветкова [2, 3], 1991-1992 гг.). В дальнейшем это направление получило значительную практическую проработку в задачах компьютерного зрения в рамках т.н. локальных бинарных шаблонов (англ. LBP - Local Binary Pattern) [4-8], а теоретическую - в работах российских авторов А.Н. Каркищенко и A.B. Гончарова [9 -11]. Работы российских авторов были посвящены знаковым представлениям изображений (термин используется по

аналогии с монографией [12]), как и более поздняя публикация [13] автора настоящей работы.

Исторически существенно раньше в экономике получила развитие т.н. теория полезности. У.Ст. Джевонс, К. Менгер и Л. Вальрас во второй половине XIX века предложили количественную теорию, а Ф. Эджуорт, В. Парето и И. Фишер - порядковую теорию полезности. Последняя предполагает работу только с результатами сопоставлений полезно-стей объектов/событий или с предпочтениями (в частном случае - при парном сравнении объектов/событий). К настоящему времени теория, основанная на предпочтениях, стала общепринятой и наиболее распространённой и составляет значимую часть теорий принятия решений и машинного обучения [14-17].

Совершенно очевидна аналогия, возникающая при рассмотрении знаковых представлений цифровых сигналов и изображений и парных сравнений теории полезности и предпочтений: в обоих случаях делается попытка анализировать/реконструировать некоторую скрытую конструкцию по её проявлениям, представленным как результаты сравнений её реакций на входные данные. При этом принципиальным отличием от задач классификации и регрессии, составляющим классическое ядро методов машинного обучения и распознавания [17], является иная форма представления данных - прецедент содержит информацию не о конкретном объекте, а о результате его сопоставления/сравнения с другим объектом. Задачи та-

кого типа в теории полезности и принятия решений получили название «выявление предпочтений» (англ.: preference elicitation).

Для конкретизации подкласса решаемых задач дадим формальное представление типовых задач машинного обучения и теории предпочтений. В задачах этого типа обычно выделяют объекты и классы/метки (англ.: labels), приписываемые конкретному объекту. Обычно выделяют три типа задач [16]:

- ранжирование/упорядочивание меток (англ.: label ranking), когда для конкретного объекта производится упорядочивание списка меток. Данная задача является обобщением классической задачи классификации, когда поступивший объект необходимо отнести к конкретному классу;

- ранжирование/упорядочивание примеров (англ.: instance ranking), когда множество конкретных объектов следует распределить по классам/меткам, причём сами метки/классы являются строго упорядоченными. Примером задач такого типа является распределение работ на конференцию по пяти типовым категориям: reject, weak reject, borderline, weak accept и accept;

- ранжирование/упорядочивание объектов (англ.: object ranking), когда множество поступивших объектов необходимо упорядочить в соответствии с некоторым представлением об их «полезности». Собственно метки в задачах этого типа не используются.

В настоящей работе рассматривается проблема ранжирования объектов по информации об их парных сравнениях. При этом в качестве «объектов» и «предпочтений» выступают соответственно:

- в компьютерном зрении -отсчёты изображения и его знаковое представление;

- при выявлении предпочтений - варианты решений и выбор пользователя (например, в задаче навигации - список маршрутов и выбранный пользователем маршрут).

Работа построена следующим образом. В первом параграфе даётся формальная постановка решаемой задачи, приводятся её конкретизация и анализ существующих подходов к её решению. Во втором параграфе представлен предлагаемый подход к решению рассматриваемой проблемы, а также к проблеме оценки качества выбираемого решения. В третьем параграфе приводятся результаты экспериментальных исследований на модельных данных теории полезности и реальных данных теории компьютерного зрения. В последнем случае оценивается эффективность предлагаемого подхода для задачи реконструкции изображения по его разреженному знаковому представлению. Завершают работу выводы, результаты, благодарности и список использованных источников.

1. Современное состояние исследований 1.1. Постановка задачи

Представим более формальную постановку рассматриваемой проблемы. С учётом превалирующего

влияния в этом направлении работ по теории полезности и принятия решений [15 -17] будем опираться на принятые в этих работах формальные обозначения.

Пусть на множестве Q = {ro/}/Ej объектов задано отношение порядка и / или строгого частичного порядка, обозначаемое далее символами «<» и/или «—». Записи ю, >- ю/ и ю/ — ю, считаем эквивалентными, в ситуации ю i < Kj л Kj < ю i объекты считаем неотличимыми и формально записываем ю, ~ ю/. В зависимости от постановки задачи считаем, что указанные отношения могут быть определены одним из двух способов. Наиболее простой вариант предполагает наличие некоторой (в общем случае неизвестной) числовой функции полезности (unity function, scoring function) u: Q^ M, характеризующей абсолютное предпочтение. Причём выполнение u (ю,) < u (ю/) эквивалентно ю i — ю/, аналогично u (ю i) < u (ю/ » ю i < ю/, а u (ю ,) = u (ю/) » ю, ~ ю/.

Очевидно, что конкретная функция полезности порождает целый класс эквивалентных ей в смысле введённого отношения порядка функций полезности. Действительно, если u (ю) является функцией полезности, то для любой монотонно возрастающей функции g: M ^ M новая функция g (u (ю)) порождает то же отношение порядка на Q.

Второй вариант предполагает использование так называемой функции предпочтения (preference function) p: Q x Q ^ M, характеризующей относительное предпочтение. Для этой функции условие p (ю,, ю/) > 0 эквивалентно условию ю, >- ю/, а p (ю,, ю/) = 0 » ю, ~ ю/. Если на функцию полезности в общем случае ограничения не накладываются, то на функцию предпочтений накладываются ограничения, естественным образом следующие из свойств отношений порядка. А именно:

- асимметричность по аргументу

p(ю/,ю,-) > 0 » p(ю,,,ю/) < 0 ;

- транзитивность

p (ю,,, ю/) > 0 л p (ю/, юt) > 0 ^ p (ю,, юt) > 0,

p (ю,,, ю/) > 0 л p (ю/, юt) > 0 ^ p (ю,,, юt) > 0; и т. п.

Достаточно очевидно, что в случае наличия любой из указанных функций альтернативная функция может быть легко получена. А именно:

- предпочтение через полезность

p (ю/, ю,,) = u (ю/) - u (ю,);

- полезность через предпочтение

u (ю/) = p (ю/, ю*) (u (ю*) = p (ю*, ю*) = 0) .

Следует отметить, что для подавляющего большинства практических приложений:

- сами объекты не являются формальными математическими объектами;

- функции полезности или предпочтений часто оказываются неизвестными.

Поэтому вместо самих объектов на практике часто имеют дело с описаниями объектов в виде векторов признаков (альтернативные названия: показателей, критериев, факторов и др.) некоторого Ж-мерного пространства X (в некоторых работах используются более сложные описания в виде определённых математических структур [16], которые в настоящей работе не рассматриваются):

х = х(со) е X .

Для сокращения записи примем: х, = х (ю,). При этом функции полезности и предпочтений в машинном обучении конструируются именно по описаниям, то есть формально в виде:

(1)

p (X, X; ), и (х).

Для исключения неоднозначности форму записи р (ю,, ю,), и (ю,) далее будем соотносить с идеальными и неизвестными функциями полезности и предпочтений, а форму (1) - с реконструируемыми, связанными с используемыми моделями и параметрами. Также для упрощения изложения примем следующие сокращения:

Р, = Р (ю,, ю,), и, = и (ю,).

Далее информация о предпочтениях при обучении может задаваться [16]:

- перечислением некоторых объектов со значениями желаемой функции полезности - прямая информация;

- в виде результатов парных сравнений р, для некоторого подмножества объектов - косвенная информация.

Заметим также, что указанная выше косвенная информация также может быть представлена двумя способами:

- явно, то есть в виде значения самой функции предпочтения р (ю,, ю,) или синтезированной функции предпочтения с использованием функции полезности р (ю,, ю,)=и (ю,) - и (ю,);

- неявно, в виде знакового представления вида:

= z (со,-, ю; ) =

p (ю,, ю;) > 0;

) = о; )< о.

1,

0, p (ю, -1, p{

;) ю,, ю i

(2)

Примерами предоставления косвенной информации в виде парных сравнений являются: выбор конкретной позиции в выдаче/списке поисковика (выбранная позиция является предпочтительной по сравнению с остальными), выбор конкретной позиции при заказе гостиницы, выбор конкретного маршрута в навигаторе и т.п.

В результате задача реконструкции предпочтений формулируется при дополнительных ограничениях и вариантах постановки. Наиболее компактно они

представлены на диаграмме монографии [16]. Переведённый вариант данной диаграммы представлен на рис. 1. Он подразумевает выбор:

- модели предпочтений (абсолютная, относительная);

- типа шкалы для модели абсолютных предпочтений (логическая, градуированная, непрерывная, конечная или бесконечная);

- полноты реконструируемых отношений (полное, частичное или парное упорядочивание всех объектов) для модели относительных предпочтений;

- способа представления обучающей информации (прямая или косвенная, обо всех объектах или о подмножестве, косвенная информация даётся в явном виде или в неявном, то есть с использованием знакового представления и т.д.).

Л в CD .9.8.1.3

А В С О

+ + - о

Рис. 1. Варианты итогового представления решения задачи оценки предпочтений

1.2. Критерии качества

Оценка качества результата решения задачи оценки полезности и предпочтений зависит от способа представления обучающей информации, выбранной модели предпочтений и полноты реконструированных отношений. Выделим два принципиально различных случая, имеющих отношение к настоящей работе.

В первом принципиально известной является исходная функция полезности и (ю) для всего множества потенциально существующих объектов. В этом случае качество реконструкции функции можно охарактеризовать погрешностью (ошибкой) следующего вида:

е' =

1 1

J g|u; - и (х j ^ , ( 6 N).

(3)

Здесь Uj, u(xj) - истинное и реконструированное значения функции полезности соответственно.

Во втором случае известными являются результаты парных сравнений на некотором подмножестве исходных объектов:

ztj = Z (ю,, ю j ), (,, j ) 6 ©С J X J .

В случае, когда множество © не позволяет реконструировать полный порядок через транзитивное замыкание отношения (© с J х J) или хотя бы частичный, а допускает только анализ парных сравнений, то целесообразными вариантами анализа качества реконструкции функции полезности или предпочтений является число неверно реконструированных отношений - расстояние Кендалла для парных сравнений (Kendall's distance), - вычисляемое в виде

d =

j): z (со,-,сj ) z (x(со,-), x(со¡)), (,, j) e ©]

Эта величина может также быть использована и в «нормированном» варианте как частота или оценка соответствующей вероятности ошибок в отношениях:

d = d 4

(4)

Более сложные способы оценки качества включают: С-индекс, статистику Jonckheere-Terpstra [16] и др.

В случае, когда множество © позволяет реконструировать полный порядок объектов через транзитивное замыкание отношения (© = Jx J), могут быть использованы более мощные способы оценки качества [16], учитывающие и абсолютное положение объектов в исходном порядке, и величину изменения ранга и т.п. В данной работе такая постановка задачи не рассматривается.

1.3. Метод парных сравнений (беспризнаковые методы)

Методы парных сравнений первоначально использовались для упорядочивания объектов/альтернатив, которые не имели признакового описания (например, упорядочивание типов фруктов для продаж в магазинах). Результаты таких сравнений обычно [15, 18] представлялись в виде матрицы (c/) абсолютных частот предпочтения i-го объекта/альтернативы над /-м. Для анализа таких данных в первой половине XX века были предложены две модели: Тёрстоуна и Брэдли-Терри.

Модель Тёрстоуна (Thurstone's model), предложенная в 1927 году [19], исходила из предположения, что полезность конкретного объекта u (ю) представляет собой случайную величину с нормальным законом распределения. То есть для объектов ю0, ю1 имеем функцию плотности вероятности:

fu (u| ю/)~ N(|/, ст2) . Тогда, очевидно: u(сю)-u(юс) ~ N((j-! -|а„: ст20 = <ст2 +ст2 - 2рюСТ! СТ0,

ст2о

здесь р10 - коэффициент корреляции. Откуда

P(сю ^ ю0 ) = P(и (сю)-и (ю0 )> о) = Ф

Ц -Цо

■ (5)

здесь Ф(...) - функция Лапласа. При численной оценке вероятности (5) как относительной частоты соответствующих предпочтений, вычисленной по матрице 0, имеем оценку величины предпочтения между альтернативами:

Ц - Цо = СТюФ-

С„

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

с1о + со1

В более упрощённом варианте модели (Thurstone's Case 5 model) предполагается отсутствие корреляции и равные дисперсии у функции полезности, которые за счёт выбора масштаба можно положить равными 0,5:

Ст2 = ctq = о,5, Рю = о -V и,о В этом случае выражение (5) упрощается:

Ц - Ц о = Ф-

с1о

с1о + со

Модель Брэдли-Терри (Bradley-Terry model), предложенная в 1952 году [14], исходила из похожих предположений. Оценивая вероятность (5) в виде

P (с1 ^ со) = -

лj =exp(цj/s)

(6)

Л + Л0

(5 - числовой неотрицательный параметр), имеем следующую оценку величины предпочтений между альтернативами:

( ( „ Л г \\

Ц - Цо = s

ln

с1о + со

- ln I 1 -

с1о + со

Позднее было показано, что соответствующее (6) распределение функции полезности является распределением Гумбеля (Gumbel distribution) [18].

1.4. Выявление предпочтений (preference elicitation) для объектов, описываемых признаками Существующие подходы к реконструкции функции полезности или предпочтения для рассматриваемой проблемы мультикритериального ранжирования/упорядочивания объектов на основе парных сравнений существенно различаются в зависимости от способа/протокола получения этих данных. Ниже представлены ключевые направления и решения.

Метод анализа иерархий (МАИ, англ: Analytic Hierarchy Process) используется для мультикритериального ранжирования в ситуации, когда ограничение в получении информации отсутствует. В этом случае первона-

чально формируются матрицы (m¡¡),-,jeJ,

n = о, N -1,

составленные из результатов опроса пользователей относительно предпочтений /-го объекта/альтернативы над ]-м по п-му критерию. Правый собственный вектор у" = (у",...,У|"|_1)г указанной матрицы, характеризующий полезность объектов/альтернатив по п-му критерию, используется для формирования итоговой полезности объектов/альтернатив в виде скалярного произведения с весовым вектором критериев

i(o j ) = £i

(7)

Ж-мерный весовой вектор критериев w получается независимо путем анализа матрицы (кпт )пт=ож-[,

элементы Кпт которой суть результаты парных сравнений экспертами п-го и т-го критериев (при ограничении кпт=(ктп)4). В результате элементы вектора весов w, участвующие в вычислении функции полезности (7), задаются в виде:

1 N-1 {N-1 '

= N ^К"т |

Ж т =0 \ ' =0

n = о, N-1.

Основной проблемой МАИ является чрезвычайно большое число парных сопоставлений (как объектов,

п=о

так и критериев), что на практике может представлять проблему [20-21]. Поэтому, оставляя в принципе неизменной линейную модель выражения (7), для реконструкции предпочтений часто используют иные методы и алгоритмы, а именно:

В работах [20, 23] рассматривается следующая линейная модель, связанная с гипотезой «обобщённой аддитивной независимости» признаков:

N -1

u (x(со)) = ^ w„ • v„ ( (со)) .

n=0

Здесь Vn (...) - некоторая числовая функция, подстраиваемая для n-го критерия/признака. В работе [22] данная функция реконструировалась на дискретном множестве значений, на которые авторы квантовали значения n-го признака. В работе [23] она полагалась тождественной аргументу, а в работе [24] предполагалась нелинейной, но предопределённой. Математический аппарат во всех указанных работах предполагал байесовский принцип оценивания неизвестного линейного вектора параметров w.

1.5. Знаковые представления изображений

Российские авторы А.Н. Каркищенко и A.B. Гончаров в цикле работ 2008-2011 годов [9-11] дали математическую проработку для метода описания изображений, названного ими «знаковым представлением изображения»: определены свойства знакового представления, введены меры информативности и неопределённости знаковых представлений, рассмотрены вопросы их устойчивости. Авторы различают полное и оконное знаковые представления: первое задаёт отношение на всех возможных парах отсчётов, в то время как второе - только на «близких» по расположению. Также авторы показали, что для конкретного знакового представления порождается целое множество эквивалентных изображений, приводящих к этому знаковому представлению. В итоге авторы связали конкретное знаковое представление с перестановкой отсчётов изображения, что позволило им разработать алгоритм реконструкции изображения, для которого это знаковое представление и указано. Следует отметить, что альтернативный эмпирический итеративный алгоритм ранее был указан О.В. Цветковым в работах [2, 3], как, собственно, и идея связать сигнал и его «знаковое представление». В зарубежной литературе «знаковое представление» обычно рассматривается в наиболее простом - оконном (3*3) - варианте, который получил название локальных бинарных шаблонов или LBP [8 -12].

Несмотря на очевидную схожесть знаковых представлений компьютерного зрения и метода парных сравнений теории полезности и принятия решений, попыток связать и рассматривать совместно эти два направления, по информации авторов, не предпринималось. Собственно, это и явилось одной из причин предлагаемого направления исследования. В настоящей работе исследуется задача реконструкции (для задач принятия решений - функции полезности/пред-

почтений, для компьютерного зрения - цифрового изображения) по данным парных наблюдений.

2. Метод реконструкции функций и цифровых изображений по их знаковому представлению 2.1. Общее описание метода

Предлагаемый метод базируется на ряде предположений. Во-первых, исходная внутренняя модель предпочтений нам не известна. При этом попытка реконструировать эту модель при малом количестве информации увенчаться успехом не может. Таким образом, при малом числе парных сравнений следует ориентироваться на простую модель, а по мере увеличения объёма доступной информации (числа пар сравнений) сложность модели следует увеличивать. Дополнительными аргументами в поддержку данного решения для систем оценки пользовательских предпочтений являются вопросы «холодного старта» системы и негативная оценка пользователями большого числа задаваемых им системой вопросов [20].

Во-вторых, заранее ориентироваться на линейную модель функции полезности/предпочтений оказывается чрезвычайно опасно. Это приводит нас к необходимости обеспечения возможности автоматического перехода к нелинейным моделям. Последнее, по убеждению автора работы, рационально сделать путём перехода в новое пространство признаков Y большей размерности. В новом пространстве существенно большей размерности в соответствии с известным утверждением [16] классы (то есть пары элементов с противоположным знаковым представлением) будут разделимы почти наверняка.

В-третьих, в значительном числе задач реконструкция функции полезности не требуется, а требуется реконструкция только знакового представления (2). То есть задача реконструкции полезности как регрессионная задача может не решаться. Более того, как показано в работах А.Н. Каркищенко, A.B. Гончарова, О.В. Цветкова, при наличии знакового представления сама функция может быть также реконструирована в символьном или числовом виде. Таким образом, более сложная регрессионная задача может быть заменена на задачу классификации. При этом при использовании линейного классификатора оказывается возможным автоматически реконструировать и функцию полезности (см. ниже п. 2.4).

В результате предлагаемое решение можно представить в виде набора этапов:

1) нормализация диапазона признаков в [0, 1];

2) выбор нового пространства описания (базиса анализа) Y;

3) перевод существующего описания - вектора x - в новое пространство признаков Y большей размерности K = dim (Y) > N;

4) решение задачи построения линейного или нелинейного классификатора в новом пространстве Y, при этом автоматически выполняется оценка функции полезности (UF) для линейного классификатора и/или функции предпочтения (PF);

5) оценка качества построенного классификатора на тестовом множестве с использованием выражений ошибок (3) и (4);

6) если оценка удовлетворительная - выход из процедуры, в противном случае - переход к этапам 3 или 2 (если исчерпали допустимые размерности выбранного пространства).

Принципиальная схема предлагаемого подхода представлена на рис. 2 и выделена пунктиром. В целом же схема, показанная на этом рисунке целиком, представляет собой принципиальную модель разработанного фреймворка (англ.: framework), который позволяет не только обеспечить исполнение указанных ранее этапов, но и провести объективную оценку предложенного подхода за счёт автоматического синтеза «неизвестных» функций полезности / предпочтений, а именно:

«идеальная» функция полезности / предпочтений задаётся в виде:

Ks -1

uS (x) = X wst -ф (x),

k =0

где (wf,wf,...,wsKs-1)T - Ks-мерный вектор коэффициентов представления функции полезности в базисе синтеза

{ (x)};

Ks-1 k=0

И размерность К модели синтеза, и сам базис синтеза, и коэффициенты представления в этом базисе являются неизвестными, при этом коэффициенты выбираются случайным образом с единственным ограничением:

W0 , W1

, w'

KS

= 1.

Вектор х в представленном выше выражении выступает в качестве первичного описания объектов/альтернатив. В случае анализа изображений вектор х - суть нормированные в интервал [0, 1] координаты отсчётов изображения.

Искомое решение ищется в форме линейного или нелинейного классификатора над КА значениями базисных функций анализа:

{фА

(x )}

Ka-1 k =0

В частности, в случае линейного классификатора имеем следующее представление реконструируемой функции полезности:

К -1

и (х)= £ < -ф^ (х)

где (w0A, wA

-1)T - KA-мерный вектор коэффи-

циентов представления функции полезности в базисе анализа, определяемый на основе обучения по результатам парных сравнений

(x,LuS (x/), (i,/)e© .

Блок синтеза предпочтений соответствует части схемы на рис. 2 с названиями «базис синтеза» и «коэффициенты синтеза». Везде ниже, в том числе в экспериментах, заглавный символ «$» соответствует этому блоку (блоку синтеза). Напротив, анализ и реконструкция функции полезности и функции предпочтения соответствует на схеме блоку «Методы машинного обучения», на который везде ниже (в том числе в экспериментах) ссылаемся, используя заглавный символ «А».

Z

Репозиторий базисов

базис аналгаа (представления) объекта

7

базис синтеза

(модели)

объекта

Коэффициенты синтеза объекта

Ks

Размерность модели синтеза

Генерация отношений

обучающие j тестовые примеры | примеры

обучающая выборка

Методы машинного обучения: реконструкция

UF

PF

тестовая выборка

КА

Размерность модели представления

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Оценка качества реконструкции модели

методы классификации: частота методы регрессии: точность (ошибка)

Показатель качества

Рис. 2. Схема предлагаемого подхода

Ниже будет представлена некоторая детализация разработанного подхода в части состава репозитория базисов, классификаторов и способов обучения.

2.2. Репозиторий базисов

В работе используются три базиса для осуществления отображений фА и фх вида:

ф: X ^ Y .

x « y(x)

1) Базис исходного представления

K = dim (Y ) = dim (X ) = N;

y„ =фи (x) = x„, n = 0, N -1.

2) Степенной (полиномиальный) базис

Многомерные базисные функции ф/^) представляют собой произведение одномерных степенных функций координат исходного вектора (для упрощения изложения полагаем Vn Kn=K0; 0 < kn < K0):

k=0

Ук = фк (х) = П хПп, k = S KSK .

n=0 n=0

Здесь:

у -1

K = П Kn = K0N = dim (Y) > dim (X) = N.

n=0

3) Фурье-базис (гармонический) Аналогично предшествующему случаю, многомерные базисные функции фк(х) представляют собой произведение одномерных гармонических (косинусных) функций от координат исходного вектора (для упрощения изложения полагаем Vn Kn=K0):

N -1 N-1

Ук =фк (х) = П cos (knxn), к = S K^kn ,

n=0 n=0

N -1

K = П Kn = KN = dim (Y) > dim (X) = N.

n=0

Нормировка признаков в диапазон [0, 1] приводит к некоторому отличию от стандартной формы записи тригонометрического ряда Фурье, содержащей, наряду с константой, синусные sin(kx) и косинусные cos(kx) базисные функции, а именно:

а) исключение синусных функций объясняется переходом от полного [-я, я] интервала к рассмотрению только его правой части [0, я];

б) ограничение максимального значения признаков единицей влечёт появление множителя «я» в аргументе тригонометрической функции.

2.3. Репозиторий методов машинного обучения (классификаторов)

В рамках предложенного подхода репозиторий методов машинного обучения (классификаторов) включает следующие:

а) логистическая регрессия (LR),

б) линейный классификатор Фишера,

в) метод опорных векторов с линейной разделяющей функцией (без ядра),

г) метод опорных векторов с радиальной базисной функцией (SVM-RBF),

д) метод ближайшего соседа,

е) дерево решений,

ж) случайный лес (RF - Random Forest). Ниже представлено их краткое описание. Логистическая регрессия решает задачу бинарной

классификации с использованием линейной разделяющей гиперплоскости

d (х) = wTх + wN . (8)

Для конкретной обучающей выборки (х_/, rj}jej параметры классификатора определяются из условия:

3(w) = S ln (i + exp (-rj • d (хj))) -— min .

jeJ

Здесь rj e(-1, 1} - случайная переменная правильной классификации, определяющая истинный класс соответствующего j-го объекта.

Линейный классификатор Фишера представим в виде (8), где

w

=G2(++*-)) (+-ц-)

wN = -w'

ст-ц + + ст+ц

ст- + ст+

Здесь ст- = wTB-w, ст+ = wTB+ w ; а Б, - вектор средних и ковариационная матрица (на практике - их оценки) векторов-признаков для соответствующих классов. Классификатор оптимален по критерию

(w ) =

(( (ц+- ц -))

-> max.

ст+ +ст-

Метод опорных векторов (англ.: SVM - Support Vector Machme) использует критерий максимизации ширины разделительной полосы и в общем случае сводится к решению задачи квадратичного программирования в виде

j + 2 j Vr^, j

jeJ ^ jeJ iej

— min;

X

0<Xj <C,

r = 0.

j eJ;

Дискриминантная функция (8) с использованием двойственных переменных Xj (jeJ) записывается следующим образом:

d (x) = X X,r,K (x, x,-) + wN,

ieJ

wn = rj - XXrK (xj, x,), j : Xj > 0.

ieJ

В представленных выражениях K() - функция ядра, которая в случае линейного SVM имеет тривиальный вид:

K (x, x') = xrx'.

Для случая использования в качестве ядра радиальных базисных функций (SVM-RBF) имеем:

K(x,x') = exp(-y||x-x'||2), (у > 0).

Метод ближайшего соседа относится к непараметрическим. Суть метода заключается в отнесении классифицируемого вектора признаков x к тому классу, к которому принадлежит ближайший из выборки элемент/объект xj.. Формально:

j* = arg mini Ix j - xll,

jeJ 11

Г (x) = rj*.

Дерево решений: при построении пространство (область значений) признаков последовательно иерархически разбивается на подпространства (подобласти), которые также иерархически подвергаются разбиению до тех пор, пока (в идеале) на терминальной вершине дерева (в малой подобласти исходного пространства) не останутся только объекты одного из классов. В простейшей реализации дерева решений при попадании вновь классифицируемого

вектора в терминальную вершину (в подобласть, за которую отвечает эта терминальная вершина) он относится к тому классу, представителей которого в этой вершине большинство.

Случайный лес - это реализация метода голосования (метода большинства) нескольких классификаторов-деревьев. Случайный лес используется для устранения эффектов переобучения, которому подвержено дерево решений. Каждое из деревьев строится на случайном подмножестве обучающего множества. Дополнительно при переходе на подуровни дерева случайным образом выбираются компоненты вектора признаков, которые могут быть использованы для определения подобластей.

2.4. Особенности использования и обучения классификаторов в задаче реконструкции функции полезности и предпочтения

Для реализации процесса обучения и решения задачи реконструкции исходим из следующих положений:

1) поскольку первые три классификатора (а)-(в) являются линейными в новом пространстве признаков Y, это позволяет использовать их (то есть результат скалярного произведения вектора признаков y на вектор весов w классификатора) и для реконструкции функции полезности (или цифрового изображения - в задачах компьютерного зрения), то есть:

u (x ) = wT y (x ).

Для настройки соответствующего классификатора решается задача классификации вида (I(...) -индикатор события):

X I ( (y (xj) - y (x,)) z, < 0min; (9)

(j .')E® w

2) в случае использования классификаторов (г)-(ж) функция полезности напрямую реконструирована быть не может. Однако, учитывая неопределённость в факте отсутствия/присутствия линейной разделимости классов, исходная задача решается с использованием указанных классификаторов в двух постановках.

а) В качестве входного вектора выступает вектор

разницы описаний

y, = y (x j)- y (x, )

и классификатор решает задачу (9) в виде: X 1(yßzß <0min. (10)

б) В качестве входного вектора выступает конкатенация векторов описаний, а именно:

yj, =( (xj),Ут (x,))T ,

и классификатор решает задачу (10) c «расширенным» вектором весовых коэффициентов:

dim (yj,) = dim (y (xj)) + dim (y (x,));

3) решения пользователей могут быть ошибочными. При этом чем меньше различие в полезностях альтернатив/объектов, тем выше вероятность ошибки. Поэтому в работе используется модель Тёрстоуна с оценкой вероятности (5) для внесения погрешностей в истинные предпочтения (2) следующим образом: при обучении верное значение знакового представления для конкретной пары (ю,, ю,) используется с вероятностью (5), а ошибочное, то есть противоположное истинному по знаку, принимается с «противоположной» вероятностью. Указанная модификация для случая ц, > ц,- может быть формально представлена следующим образом (в выражении - случайная величина, равномерно распределенная на отрезке [0, 1]; z- - величина, используемая при обучении):

Iz(юj,ю,), < P(и (ю, ) -u (ю,) > 0 -z (ю,, ю,-), иначе.

Дисперсия функции полезности полагается одинаковой и равной наперёд определённой величине Du. То есть в выражении (5): ст2 = ст2 = Du, корреляция pío = 0, откуда ст20 = 2Du;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4) для устранения эффектов, связанных с «удачными» или, наоборот, «неудачными» распределениями обучающих и тестовых выборок, обучение и тестирование классификаторов при фиксированном наборе параметров метода производится независимо R раз. Результаты расчёта ошибок усредняются.

3. Экспериментальные исследования предложенного подхода 3.1. Исследование эффективности реконструкции предпочтений на модельных данных

Цель экспериментов:

- подтвердить работоспособность предложенного подхода;

- определить наличие или отсутствие преимущества в использовании оценки полезности по сравнению с предпочтениями (сопоставить варианты 1 и 2 из подпараграфе 2.4);

- оценить информативность показателей качества, рассчитанных по обучающей выборке;

- выявить эффективные классификаторы, как приводящие к линейной модели, так и непараметрические;

- исследовать зависимость точности реконструкции функций полезности/предпочтений (ошибок реконструкции в форме (3) и (4)) от числа T использованных парных сравнений (показатель s в выражении ошибки (3) во всех экспериментах полагался s = 2);

- исследовать влияние дисперсии функции полезности Du на ошибки (3) и (4) реконструкции;

- сравнить эффективность различных базисов.

Для достижения указанных целей были проведены

эксперименты со следующим набором параметров

фреймворка (базисы и алгоритмы классификации были представлены во втором параграфе):

- К = 3, 8, 15, 35;

- Ка = 3, 8, 15, 35, 63, 99;

- Т = 500, 1000, 5000, 10000, 20000, 50000;

- Би = 0 или 0,01;

- Я = 100.

Поскольку объём настоящей публикации не позволяет представить здесь все численные результаты (они занимают несколько страниц), наиболее наглядные и содержательные фрагменты представлены на отдельных таблицах ниже. Необходимость подобного «массированного» исследования косвенно подтверждается наличием аналогичных работ [26]. Качественные выводы следующие:

- преимуществ в использовании оценки полезности по сравнению с предпочтениями (и наоборот) не выявлено;

- ошибки (4), рассчитанные по обучающей выборке, могут оказаться сколь угодно малыми при чрезвычайно высоких значениях ошибок на тестовой выборке;

- качественные показатели линейных классификаторов сопоставимы, однако логистическая регрессия имеет значительное преимущество по скорости и устойчивости (для больших Т);

- случайный лес даёт лучшие качественные показатели среди нелинейных классификаторов;

- базис Фурье показал лучшие качественные результаты, чем степенной (см. табл. 1);

- ошибка реконструкции функций полезности/предпочтений от числа использованных парных сравнений ожидаемо снижается и ограничена описательной способностью Ка базисных функций (см. табл. 2);

- при большом Т влияние дисперсии функции полезности Би на ошибки реконструкции полезности/предпочтений в достаточно широком диапазоне Би ограничено (см. табл. 3), а именно: при возрастании дисперсии в 100 раз (с 0,0025 до 0,25) ошибки возросли в три и семь раз соответственно.

В целом предложенный подход продемонстрировал как работоспособность, так и эффективность в реконструкции как функции полезности, так и функции предпочтения.

Табл. 1. Результаты сравнения Фурье и степенного базисов (ЪЯ - логистическая регрессия, ЯЕ - случайный лес)

Ks Ka T Ошибка (4)

A: Фурье S: полином A: поли S: Фу шом рье

LR RF LR RF

35 35 10000 0,2864 0,1828 0,0076 0,0145

35 35 50000 0,3341 0,1237 0,0067 0,0083

35 63 10000 0,3059 0,1945 0,0062 0,0141

35 63 50000 0,2633 0,1223 0,0049 0,0084

3.2. Исследование эффективности реконструкции цифрового изображения по его разреженному знаковому представлению

Цель экспериментов:

- подтвердить возможность реконструкции изображения по разреженному знаковому представлению;

- исследовать зависимость погрешности (3) реконструкции цифрового изображения от числа ис-

пользованных парных сравнений (в процентном отношении от числа отношений в полном знаковом представлении, см. табл. 4); - исследовать зависимость погрешности реконструкции цифрового изображения от дисперсии Би.

Табл. 2. Зависимость ошибки (4) реконструкции функции полезности от числа использованных парных сравнений

T 500 1000 5000 10000 20000 50000

Ks = 35 Ka = 15 0,012 0,013 0,0128 0,011 0,0111 0,0092

Ks = 35 Ka = 35 0,03 0,019 0,0048 0,0076 0,00715 0,00668

Ks = 35 Ka = 63 0,058 0,014 0,006 0,0062 0,00495 0,00495

Табл. 3. Зависимость ошибки (4) реконструкции функции полезности от её дисперсии Би

Du Ошибка (4)

LR RF

0 0,0043 0,012

0,0025 0,00945 0,01705

0,01 0,0144 0,0287

0,04 0,0135 0,05085

0,09 0,02195 0,06475

0,16 0,02905 0,09345

0,25 0,029 0,1228

0,36 0,03255 0,13755

Табл. 4. Зависимость ошибок (3) и (4) реконструкции цифрового изображения от числа парных сравнений

(part— в процентном отношении от числа отношений в полном знаковом представлении)

Ka T part, % s2 d обуч. d тест

24 1000 0,8 0,685 0,242 0,262

24 2000 1,6 0,663 0,249 0,256

24 5000 3,9 0,653 0,250 0,254

24 10000 7,9 0,650 0,253 0,256

24 50000 39,4 0,648 0,253 0,253

99 1000 0,8 0,177 0,058 0,112

99 2000 1,6 0,150 0,074 0,100

99 5000 3,9 0,131 0,083 0,094

99 10000 7,9 0,131 0,084 0,088

99 50000 39,4 0,125 0,086 0,087

224 1000 0,8 0,173 0,002 0,114

224 2000 1,6 0,126 0,020 0,083

224 5000 3,9 0,081 0,041 0,063

224 10000 7,9 0,070 0,047 0,059

224 50000 39,4 0,062 0,052 0,054

Выводы настоящего параграфа в целом повторяют выводы подпараграфа 3.1. В частности, ошибка реконструкции цифрового изображения от числа использованных парных сравнений ожидаемо снижается и ограничена описательной способностью базиса: при малом количестве базисных функций (24 и 99) снижение ошибки при росте Т не происходит. На рис. 3 продемонстрированы реконструированные изображения при различном числе базисных функций. В целом, предложенный подход продемонстрировал возможность реконструкции изображения по разреженному знаковому представлению.

Выводы и результаты

В работе предложен подход к реконструкции функций и цифровых изображений, заданных неявно

результатами парных сравнений значений функции для двух случайных аргументов. Он основан на переходе в пространство высокой размерности с последующей классификацией прецедентов-сравнений. Показано, что предложенный подход позволяет эффективно решать как задачи оценки функции полезности и/или предпочтения в теории принятия решений, так и задачу реконструкции цифрового изображения по его разреженному знаковому представлению.

Т = 1000 (0,8%) Т

К=24

б) Ш Ш в)

К=99

г)

К=224

е)

Рис. 3. Исходное (а) и реконструированные (б)-(ж) изображения, размер оригинала - 24*21 отсчетов

Представляются перспективными следующие

направления развития настоящей работы:

1) использование альтернативной схемы генерации пар сопоставлений, более подходящей для системы оценки пользовательских предпочтений: обычно пользователь выбирает один вариант из нескольких (Ь), что определяет сразу Ь-1 отношение;

2) расширение репозитория базисов синтеза/анализа, например, использование вейвлетов;

3) расширение репозитория используемых методов машинного обучения, в частности, использование нейросетей и глубокого обучения (существуют работы с их использованием в смежных задачах оценки предпочтений [25]);

4) исследование возможности и эффективности использования «степени уверенности» пользователя в принятом решении;

5) исследование возможности и эффективности использования критериев с полным ранжированием объектов за счёт транзитивного замыкания отношений отдельных объектов в комбинации с реконструируемой функцией полезности;

6) для случая реконструкции цифровых изображений - исследование возможности и эффективно-

сти использования пирамиды разрешений и соответствующих парных сравнений на других уровнях этой пирамиды.

Благодарности Работа выполнена при поддержке Министерства науки и высшего образования в рамках выполнения работ по Государственному заданию ФНИЦ «Кристаллография и фотоника» РАН в части «Введение» и параграфа (1) «Современное состояние исследований», и грантов РФФИ (№ 18-01-00748, 18-29-03135-мк и 17-29-03190-офи) в части параграфов: (2) «Метод реконструкции функций и цифровых изображений по их знаковому представлению» - (4) «Выводы и результаты».

Литература

1. He, D.C. Texture unit, texture spectrum, and texture analysis / D.C. He, L. Wang // IEEE Transactions on Geoscience and Remote Sensing. - 1990. - Vol. 28. - P. 509-512.

2. Цветков, О.В. Вычисление оценки энтропии биосигнала, инвариантной к изменению его амплитуды, с использованием рангового ядра // Известия вузов. Радиоэлектроника. - 1991. - Т. 34, № 8. - С. 108-110.

3. Цветков, О.В. Оценка близости числовых последовательностей на основе сопоставления их ранговых ядер // Известия вузов. Радиоэлектроника. -1992. - № 8. - С. 28-33.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Ojala, T. Performance evaluation of texture measures with classification based on Kullback discrimination of distributions / T. Ojala, M. Pietikainen, D. Harwood // Proceedings of the 12th IAPR International Conference on Pattern Recognition (ICPR 1994). - 1994. - Vol. 1. - P. 582-585.

5. Ojala, T. A comparative study of texture measures with classification based on feature distributions / T. Ojala, M. Pietikinen // Pattern Recognition. - 1996. - Vol. 29. -P. 51-59.

6. Pietikainen, M. Computer vision using local binary patterns / M. Pietikainen, A. Hadid, G. Zhao, T. Ahonen. -London: Springer-Verlag, 2011. - 212 p. - ISBN: 978-085729-747-1.

7. Brahnam, S. Local binary patterns: New variants and applications / S. Brahnam, C. Lakhmi, L. Nanni, A. Lumini. -Berlin, Heidelberg: Springer-Verlag, 2014.

8. Ojala, T. Multiresolution grayscale and rotation invariant texture classification with local binary patterns / T. Ojala, M. Pietikinen, T. Menp // IEEE Transactions on Pattern Analysis and Machine Intelligence. - 2002 - Vol. 24, Issue 7. - P. 971-987.

9. Гончаров, A.B. Исследование свойств знакового представления изображений в задачах распознавания образов / A.B. Гончаров // Известия ЮФУ. Технические науки. - 2009. - Тематический выпуск. - С. 178-188.

10. Каркищенко, А.Н. Исследование устойчивости знакового представления изображений / А.Н. Каркищенко // Автоматика и телемеханика. - 2010. - Т. 9. - С. 57-69.

11. Броневич, А.Г. Анализ неопределенности выделения информативных признаков и представлений изображений / А.Г. Броневич, А.Н. Каркищенко, А.Е. Лепский // М.: Физматлит, 2013. - 320 с.

12. Болдин, М.В. Знаковый статистический анализ линейных моделей / М.В. Болдин, Г.И. Симонова, Ю.Н. Тюрин; под ред. Е.Ю. Ходан. - М.: Наука, 1997. -288 с.

д)\

ж)

13. Мясников, В. В. Локальное порядковое преобразование цифровых изображений / В. В. Мясников // Компьютерная оптика. - 2015. - Т. 39, № 3. - С. 397405. - DOI: 10.18287/0134-2452-2015-39-3-397-405.

14. Bradley, R.A. Rank analysis of incomplete block designs: I. The method of paired comparisons / R.A. Bradley, M.E. Terry // Biometrika. - 1952. - Vol. 39, No. 3/4. -P. 324-345. - DOI: 10.2307/2334029.

15. Фишберн, П. Теория полезности для принятия решений / П. Фишберн; пер. с англ. - М.: Наука, 1978. - 352 с.

16. Preference learning / ed. by J. Furnkranz, E. Hullermeier. -Berlin, Heidelberg: Springer-Verlag, 2011. - ISBN: 978-3642-14124-9.

17. Murphy, K.P. Machine learning: A probabilistic perspective / K.P. Murphy. - MIT Press, 2012. - 1098 p.

18. Tsukida, K. How to analyze paired comparison data / K. Tsukida, M.R. Gupta. - UWEE Technical Report Number UWEETR-2011-0004. - Seattle, Washington: 2011. - 27 p.

19. Thurstone, L.L. A law of comparative judgment / L.L. Thurstone // Psychological Review. - 1927. - Vol. 34, No. 4. - P. 273-286. - DOI: 10.1037/h0070288.

20. Saaty, T.L. Relative measurement and its generalization in decision making why pairwise comparisons are central in mathematics for the measurement of intangible factors the analytic hierarchy/network process / T.L. Saaty // RACSAM - Revista de la Real Academia de Ciencias Exactas, Fisicas y Naturales. Serie A. Matematicas. - 2008. - Vol. 102, No. 2. - P. 251-318. - DOI: 10.1007/BF03191825.

21. Viappiani, P. Preference modeling and preference elicita-tion: An overview / P. Viappiani // CEUR Workshop Proceedings. - 2014. - Vol. 1278. - P. 19-24.

22. Guo, S. Real-time multiattribute Bayesian preference elici-tation with pairwise comparison queries / S. Guo, S. Sanner // Journal of Machine Learning Research. - 2010. - Vol. 9.

- P. 289-296.

23. Arentze, T.A. Adaptive personalized travel information systems: A bayesian method to learn users' personal preferences in multimodal transport networks / T.A. Arentze // IEEE Transactions on Intelligent Transportation Systems. -2013. - Vol. 14, Issue 4. - P. 1957-1966. - DOI: 10.1109/TITS.2013.2270358.

24. Campigotto, P. Personalized and situation-aware multimodal route recommendations: The FAVOUR algorithm / P. Campigotto, C. Rudloff, M. Leodolter, D. Bauer // IEEE Transactions on Intelligent Transportation Systems. - 2017.

- Vol. 18, Issue 1. - P. 92-102. - DOI: 10.1109/TITS.2016.2565643.

25. Zhang, S. Deep learning based recommender system: A survey and new perspectives / S. Zhang, L. Yao, A. Sun, Y. Tay // ACM Computing Surveys. - 2019. - Vol. 52, Issue 1. - 5 (38 p.).

26. Melnikov, V. Pairwise versus pointwise ranking: A case study / V. Melnikov, P. Gupta, B. Frick, D. Kaimann, E. Hullermeier // Schedae Informaticae. - 2016. - Vol. 25. -P. 73-83. - DOI: 10.4467/20838476SI.16.006.6187.

Сведения об авторе

Мясников Владислав Валерьевич, в 2008 защитил диссертацию на соискание степени доктора физико-математических наук. Работает профессором кафедры геоинформатики и информационной безопасности Самарского национального исследовательского университета имени академика С.П. Королева и одновременно ведущим научным сотрудником в ИСОИ РАН - филиале ФНИЦ «Кристаллография и фотоника» РАН. Круг научных интересов: компьютерное зрение, распознавание образов, искусственный интеллект, машинное обучение и геоинформатика. Имеет более 200 публикаций, в том числе более 100 статей и три монографии (в соавторстве). Страница в интернете: http://www.ssau.ru/staff/62061001-Myasnikov-Vladislav-Valerevich. E-mail: vmyas@geosamara.ru .

ГРНТИ: 28.23.15, 28.23.27 Поступила в редакцию 15 октября 2019 г. Окончательный вариант - 15 октября 2019 г.

Reconstruction of functions and digital images using sign representations

V.V. Myasnikov1,2

1Samara National Research University, Moskovskoye Shosse 34, 443086, Samara, Russia, 2IPSI RAS - Branch of the FSRC "Crystallography and Photonics" RAS, Molodogvardeyskaya 151, 443001, Samara, Russia

Abstract

The paper deals with the reconstruction of implicitly defined functions or digital images. Functions are defined using observations, each of which is the result of a pairwise comparison of the function values for two random arguments. The analysis of the current state of research for particular statements of this problem is presented: the method of pairwise comparisons used in decision-making for a finite set of alternatives; reconstruction of preference/utility function in multicriteria tasks; sign representations of images used for the description and analysis of digital images. A unified approach to reconstructing functions and images according to their sign representations is proposed, based on mapping in a high-dimensional space and constructing a linear (when reconstructing a function and images) or non-linear (including non-parametric) classifier (when reconstructing preferences). For a number of classification algorithms, experimental studies have been conducted to evaluate the effectiveness of the proposed approach using the example of the reconstruction of the utility function in problems of decision theory and reconstruction of the brightness function of real images.

Keywords: pairwise comparisons, sign representation, utility function, preference function, preferences elicitation, decision making, machine learning, digital image.

Citation: Myasnikov VV. Reconstruction of functions and digital images using sign representations. Computer Optics 2019; 43(6): 1041-1052. DOI: 10.18287/2412-6179-2019-43-6-1041-1052.

Acknowledgements: This work was partly funded by the Ministry of Science and Higher Education under a government project of FSRC "Crystallography and Photonics" RAS ("Introduction" and "State of the Art") and the Russian Foundation for Basic Research under grants ##18-01-00748, 18-29-03135-mk, and 17-29-03190-ofi (Sections 2-4: "Method of function or digital image reconstruction using sign representation" - "Conclusions and Results").

References

[1] He DC, Wang L. Texture unit, texture spectrum, and texture analysis. IEEE Transactions on Geoscience and Remote Sensing 1990; 28: 509-512.

[2] Tsvetkov OV. Computation of biosignal entropy invariant to its amplitude variation using kernel rank [In Russian]. Izvestiya VUZ: Radioelektronika 1991; 34: 108-110.

[3] Tsvetkov OV. Estimation of the proximity of numerical sequences based on a comparison of their rank kernels [In Russian]. Izvestiya VUZ: Radioelektronika 1992; 8: 28-33.

[4] Ojala T, Pietikainen M, Harwood D. Performance evaluation of texture measures with classification based on Kull-back discrimination of distributions. Proc 12th IAPR Int Conf Pattern Recogn (ICPR) 1994; 1: 582-585.

[5] Ojala T, Pietikinen M. A comparative study of texture measures with classification based on feature distributions. Patt Recogn 1996; 29: 51-59.

[6] Pietikainen M, Hadid A, Zhao G, Ahonen T. Computer vision using local binary patterns. London: Springer-Verlag; 2011. ISBN: 978-0-85729-747-1.

[7] Brahnam S, Lakhmi C, Nanni L, Lumini A. Local binary patterns: New variants and applications studies. Berlin, Heidelberg: Springer-Verlag; 2014.

[8] Ojala T, Pietikinen M, Menp T. Multiresolution grayscale and rotation invariant texture classification with local binary patterns. IEEE Transactions on Pattern Analysis and Machine Intelligence 2002; 24(7): 971-987.

[9] Goncharov AV. Investigation of the properties of images sign representation in the pattern recognition problems [In Russian]. Izvestiya SFedU. Engineering Sciences 2009; Special Issue: 178-188.

[10] Karkishenko AN. Stability investigation of the sign representation of images [In Russian]. Avtomatika i Teleme-hanika 2010; 9: 57-69.

[11] Bronevich AG, Karkishchenko AN, Lepskiy AN. Uncertainty analysis of extracting features and representations from images [In Russian]. Moscow: "Fizmatlit" Publisher; 2013.

[12] Boldin MV, Simonova GI, Tyurin YN. Sign-based methods in linear statistical models. Providence, Rhode Island: American Mathematical Society; 1997.

[13] Myasnikov VV. A local order transform of digital images. Computer Optics 2015; 39(3): 397-405. DOI: 10.18287/0134-2452-2015-39-3-397-405.

[14] Bradley RA, Terry ME. Rank analysis of incomplete block designs: I. The method of paired comparisons. Biometrika 1952; 39: 324-345. DOI: 10.2307/2334029.

[15] Fishburn PC. Utility theory for decision making. Wiley; 1970.

[16] Furnkranz J, Hullermeier E, eds. Preference learning. Berlin, Heidelberg: Springer-Verlag; 2011. ISBN: 978-3-642-14124-9.

[17] Murphy KP. Machine learning: A probabilistic perspective. MIT Press; 2012.

[18] Tsukida K, Gupta MR. How to analyze paired comparison data. UWEE Technical Report Number UWEETR-2011-0004. Seattle, Washington: 2011.

[19] Thurstone LL. A law of comparative judgment. Psychological Review 1927; 34(4): 273-286. DOI: 10.1037/h0070288.

[20] Saaty TL. Relative measurement and its generalization in decision making why pairwise comparisons are central in mathematics for the measurement of intangible factors the analytic hierarchy/network process. Rev R Acad Cien Serie A Mat 2008; 102: 251-318. DOI: 10.1007/BF03191825.

[21] Viappiani P. Preference modeling and preference elicita-tion: An overview. CEUR Workshop Proceedings 2014; 1278: 19-24.

[22] Guo S, Sanner S. Real-time multiattribute Bayesian preference elicitation with pairwise comparison queries. Journal of Machine Learning Research 2010; 9: 289-296.

[23] Arentze TA. Adaptive personalized travel information systems: A bayesian method to learn users' personal preferences in multimodal transport networks. IEEE Transactions on Intelligent Transportation Systems 2013; 14: 1957-1966. DOI: 10.1109/TITS.2013.2270358.

[24] Campigotto P, Rudloff C, Leodolter M, Bauer D. Personalized and situation-aware multimodal route recommendations: The FAVOUR algorithm. IEEE Transactions on Intelligent Transportation Systems 2017; 18: 92-102. DOI: 10.1109/TITS.2016.2565643.

[25] Zhang S, Yao L, Sun A, Tay Y. Deep learning based rec-ommender system: A survey and new perspectives. ACM Comput Surv 2019; 52(1): 5. DOI: 10.1145/3285029.

[26] Melnikov V, Gupta P, Frick B, Kaimann D, Hullermeier E. Pairwise versus pointwise ranking: A case study. Schedae Informaticae 2016; 25: 73-83. DOI: 10.4467/20838476SI.16.006.6187.

Author's information

Vladislav Valerievich Myasnikov, received his DrSc degree in Physics & Maths (2008). Currently he works as a professor at the Geoinformatics and Information Security department in Samara National Research University and, at the same time, as a leading researcher at the IPSI RAS, a branch of the Russian Academy of Sciences 'Crystallography and Photonics' RAS. The range of scientific interests: computer vision, pattern recognition and artificial intelligence, machine learning and geoinformatics. He has about 200 publications, including more than 100 articles and three monographs. http://www.ssau.ru/staff/62061001-Myasnikov-Vladislav-Valerevich . E-mail: vmyas@geosamara.ru .

Received October 15, 2019. The final version - October 15, 2019.

i Надоели баннеры? Вы всегда можете отключить рекламу.