Один из возможных способов отбора порогов - это решение задачи оптимизации [3]:
d kj
SSУу ^ min'
j=1 i=1
d kj
SSaZiyv * 1'г e K +'w e K-•
j=1 i=1
Цель данной задачи - снижение числа порогов, достаточных для разделения объектов различных классов.
Введем меру робастности порога [4]:
г/ = г (ßj) = min x, -ßj •
xeD I j I
Изменим модель оптимизации следующим образом:
d kj
SSg (г) Уу ^ min'
j=1 i=1
d kj
SSa7yn * 1'z e K +' w e K-•
j=1 i=1
Здесь g (z) - положительная убывающая функция, например, g (z) = 1/ z .
Определение порогов в соответствии с данной моделью оптимизации позволяет находить такое расположение порогов, которое способствует лучшему качеству классификатора. Данный подход полезен при решении многих практических задач, например [5].
Библиографические ссылки
1. Краева Е. М., Масич И. С. Методы отбора закономерностей в логических алгоритмах распознавания // Решетневские чтения : материалы XVII Между -нар. науч. конф. / СибГАУ. Красноярск, 2013.
2. Краева Е. М., Масич И. С. Бинаризация вещественных признаков для построения логических закономерностей // Решетневские чтения : материалы XVIII Междунар. науч. конф. ; СибГАУ. Красноярск, 2014.
3. Boros E., Hammer P. L., Ibaraki T., Kogan A. Logical analysis of numerical data // Mathematical Programming. 1997. № 79. Р. 163-190.
4. Antony M., Ratsaby J. Robust cutpoints in the logical analysis of numerical data // Discrete Applied Mathematics. 2012. № 160. Р. 355-356.
5. Казаковцев Л. А., Орлов В. И., Ступина А. А., Масич И. С. Задача классификации электронной компонентной базы // Вестник СибГАУ. 2014. № 4(56). С. 55-61.
References
1. Kraeva E. M., Masich I. S. Methods for pattern selection in logical algorithms of recognition // Materialy XVII Mezhdunarodnoy nauchnoy konferentsii "Reshetnevskie chteniya", Krasnoyarsk, 2013.
2. Kraeva E. M., Masich I. S. Binarization of real attributes for constructing logical rules. Materialy XVIII Mezhdunarodnoy nauchnoy konferentsii "Reshetnevskie chteniya", Krasnoyarsk, 2014.
2. Boros E., Hammer P.L., Ibaraki T., Kogan A. Logical analysis of numerical data // Mathematical Programming. 1997. No.79, рр. 163-190.
4. Antony M., Ratsaby J. Robust cutpoints in the logical analysis of numerical data // Discrete Applied Mathematics. 2012. No. 160, рр. 355-356.
5. Kazakovtsev L. A., Orlov V. I., Stupina A. A., Masich I. S. The problem of classifying electronic components // Vestnik SibGAU. 2014. No. 4(56), рр. 55-61.
© Краева Е. М., Масич И. С., 2015
УДК 004.414.23
ИСПОЛЬЗОВАНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ В ЗАДАЧЕ ОПРЕДЕЛЕНИЯ КАЧЕСТВА МЕЖДИАЛОГОВОГО ВЗАИМОДЕЙСТВИЯ ПО ТИПУ «ЧЕЛОВЕК-ЧЕЛОВЕК»*
У. Н. Круглова1, А. В. Спирина2
1 Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31
E-mail: [email protected] 2Ульмский университет Германия, 89081, г. Ульм, аллея Альберта Эйнштейна, 43 E-mail: [email protected]
Рассматривается применение методов снижения признакового пространства, статистической обработки нечисловых данных и моделирования для решения задачи определения качества диалога.
Ключевые слова: нейронные сети, метод главных компонент, нечисловые данные, автоматическая настройка нейронной сети.
*
Работа выполнена при финансовой поддержке Министерства образования и науки Российской Федерации в рамках проекта М'МЕЕ157414Х0037.
Решетнеескцие чтения. 2015
USING ARTIFICIAL NEURAL NETWORKS IN THE PROBLEM OF INTERACTION QUALITY
IN "HUMAN-HUMAN" CONVERSATIONS
U. N. Kruglova1, A. V. Spirina2
1Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: [email protected] 2Ulm University 43, Albert Einstein Alee, Ulm, 89081, Germany E-mail: [email protected]
This article considers the use of methods to reduce the feature space, the statistical treatment of non-numeric data and modeling to determine the dialogue quality.
Keywords: neural networks, principal component analysis, non-numeric data, automatic configuration of the neural network.
В современном мире идет прогресс развития технологии и техники. Все больше отраслей производства, бизнес-процессов и человеческого быта требуют не просто машинного вмешательства, а ведение диалога с машинными системами. Примерами могут служить голосовое управление аппаратными средствами, получение информации в общественных службах, звонки са11-центров и даже управление домашними гаджетами. Разработчики подобных систем сталкиваются с такими проблемами, как недопонимание между машиной и человеком. Корень проблемы кроется в том, что человеческая речь является сложным, отлаженным столетиями механизмом, тогда как компьютерное мышление ограничено зашитыми в него алгоритмами. Компьютеры не имеют смекалку, интуицию и эмоциональный фактор. При исследовании этой проблемы было решено, что необходимо привить компьютерному интеллекту человеческие качества. Для того, чтобы как можно точнее понимать закономерности в человеческом диалоге, необходимо строить модели самого человеческого общения. Так появилась задача определения качества междиалогового взаимодействия по типу «человек-человек».
Задача состоит в следующем: имеются записи диалогов по типу са11-центров. Речевой компонент был обработан и представлен в виде числовых, качественных и статистических показателей, всего их более 384. Диалог разделен на несколько этапов, в каждом из которых статистически оцениваются различные показатели, и определяется экспертом качество диалога. Качество диалога представляется в виде 5 классов, где 5-й класс обозначает самый лучший расклад, а 1-й - самый худший. Таким образом, каждому элементу выборки может соответствовать около 1000 параметров или даже более. Необходимо построить модель, которая сможет оценить качество диалога в каждый момент времени, т. е. качество каждого выделенного фрагмента [1].
Сегодня существует огромное количество методов, позволяющих строить модели сложных систем с многовариантными наборами данных. Разнообразие подходов неслучайно - разные типы систем и базы данных требуют определенные инструменты при по-
строении их моделей. Мы предлагаем построить модель рассмотренной ранее системы с помощью ИНС. Нейронные сети являются общим и эффективным методом для анализа данных. Однако количество параметров в задаче велико. Такое число данных может повлечь большие трудности при вычислительном процессе и негативно отразиться на качестве классификации. Это является причиной постановки еще одной задачи - снижение признакового пространства или выбор наиболее информативных признаков.
Существуют базовые, классические методы снижения признакового пространства. Одним из ключевых подходов является метод главных компонент (МГК). Вычисление главных компонент может быть сведено к вычислению сингулярного разложения матрицы данных или к вычислению собственных векторов и собственных значений ковариационной матрицы исходных данных [2].
МГК является классическим, эффективным методом уменьшения признакового пространства путем сжатия (линейной комбинацией) нескольких признаков в один. Однако возникают трудности использования такого подхода, если исследуемый объект имеет не только числовые, но и качественные характеристики. В таком случае необходима предобработка данных. Одним из решений подобных проблем является группировка элементов объекта с одинаковыми качественными признаками, в результате чего становится возможным применение МГК внутри каждой группировки при фиксированном качественном показателе. Другой способ - проводить шкалирование нечисловых признаков. В статистике объектов нечисловой природы предложено использовать показатель различия d : X2 ^ [0, +»), где его содержательный смысл
заключается в следующем: чем больше d(x, у), тем больше различаются x и у, и определяет эмпирическое среднее как решение экстремальной задачи [3].
Несмотря на всю обоснованность и популярность использования метода главных компонент, он не является лучшим способом и имеет недостатки. Одним из таких недостатков можно обозначить линейность преобразования факторов. Линейность МГК может не учитывать некоторые важные характеристики струк-
туры данных. Поэтому часто рассматривают вариант нелинейного МГК. В качестве нелинейного МГК подразумевают автоассоциативные нейронные сети. Такие сети обучают выдавать в качестве выходов свои собственные входы, при этом промежуточные слои содержат меньшее количество нейронов, чем входной (выходной) слой. Тем самым для восстановления своих исходных данных сети потребуется научиться представлять их в более низкой размерности [4].
При исследовании задачи определения качества междиалогового взаимодействия невозможно заранее однозначно определить, какой из рассмотренных методов позволит сжать данные с наименьшей потерей информации, поэтому необходимо провести исследование каждого из методов и сравнить их результаты.
После выбора нового набора сжатых данных необходимо построить саму модель системы с помощью ИНС, которая позволит классифицировать качество диалога. Определенное неудобство может вызвать сама настройка ИНС. В сложных задачах особенно важно подобрать «удачную» структуру для получения адекватных результатов, что порождает еще одну задачу - автоматическую настройку нейронной сети.
Определенный интерес вызывает идея настройки ИНС по типу человеческих рассуждений или же по типу настройки экспертом. Существует подход, имитирующий рассуждения человека, - нечеткая логика (НЛ). Важной особенностью НЛ является использование лингвистических переменных. Применяется НЛ при недостаточном знании объекта управления, но при наличии опыта управления им, в нелинейных системах, идентификация которых слишком трудоемка, а также в случаях, когда по условию задачи необходимо использовать знания эксперта [5]. Согласно этому возможно реализовать автоматическое построение структуры ИНС, управляемое соответствующими правилами.
Основываясь на том, что задача определения качества диалога по типу «человек-человек» является сложной и содержит большое количество смешанных данных, мы приходим к следующему выводу: стандартное построение модели окажется недостаточным, необходимо провести многоуровневую обработку параметров системы и использовать расширенный
функционал в методе моделирования. Результаты исследования будут представлены в докладе.
Библиографические ссылки
1. Спирина А., Семёнкин Е., Шмитт А., Минкер В. Качество взаимодействия в разговорах типа «человек-человек»: проблемы и возможные решения // Журнал Сибирского федерального университета. Математика и физика. 2015. № 8(2). С. 217-223.
2. Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика. Классификация и снижение размерности. М. : Финансы и статистика, 1989. 607 с.
3. Орлов А. И. Прикладная статистика. М. : Экзамен, 2004.
4. Аджемов С. С., Терешонок М. В., Чиров Д. С., Снижение размерности признакового пространства в задачах идентификации излучающих объектов по данным радиомониторинга с использованием искусственных нейронных сетей / МТУСИ. М., 2008.
5. Методы робастного, нейро-нечеткого и адаптивного управления : учебник / под ред. Н. Д. Егупо-ва. 2-е изд. М. : Изд-во МГТУ им. Бауман, 2002. 744 с.
References
1. Spirina А., Semenkin E., Schmitt A., Minker W. Interaction Quality in Human-Human Conversations: Problems and Possible Solutions // J. of Siberian Federal University. Mathematics & Physics. 2015. No. 8(2), рр. 217-223.
2. Ayvazyan S., Buchstaber V., Enyukov J., Meshalkin L. Applied Statistics. Classification and reduction of dimension. M. : Finance and Statistics, 1989. 607 p.
3. Orlov A. Applied Statistics. M. : Exam, 2004.
4. Adjemov S., Tereshonok M., Chirov D. Reducing the dimension of feature space in problems of identification emitting objects according to radio monitoring with the use of artificial neural networks. MTUCI, 2008.
5. Methods of robust, neuro-fuzzy and adaptive control : textbook / ed. N. D. Egupova, ed. 2nd. M. : Publishing House of the MSTU. Bauman, 2002. 744 p.
© Круглова У. Н., Спирина А. В., 2015
УДК 62.501
О АГ-МОДЕЛЯХ МНОГОМЕРНЫХ БЕЗЫНЕРЦИОННЫХ СИСТЕМ
М. В. Кузьмин, Т. В. Мальцева, А. В. Медведев
Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31
E-mail: [email protected]
Рассматривается задача идентификации многомерной безынерционной системы: компоненты вектора выходных переменных стохастически зависимы, априорная информация о каналах связи соответствует различным уровням неопределённости.
Ключевые слова: непараметрические алгоритмы управления, априорная информация, многосвязность, комбинированная система, прогнозирование.