Автоматическое извлечение информативных признаков в задаче распознавания состояния дистанционного студента

Брестер Кристина Юрьевна; Вишневская Софья Романовна

ех = 23.60,е2 = 57.60,е2 = -9.10,е4 =-13.6°,^, = 47.10,^2 = 10.6°,^3 = -9.50,^4 =-8.40; ех = 12.60,е2 = 45.60,е3 =-65.20,е4 = -8.60Д = 13.60,^2 = 57.20Д =-7.60Д = 10.40.

Следует отметить, что при программной реализации процедуры расчета параметров Стокса необходимо стремится к сокращению рисков качества программных изделий [4, 5, 6]

Выводы. Предложена схема нахождения параметров Стокса рассеянного излучения при исследовании удаленных космических объектов для случая расположения поляризационных элементов между исследуемым объектом и фотоприемником. Численно рассчитаны оптимальные значения параметров поляризационных элементов.

Список литературы:

1. Розенберг Г. В. Вектор-параметр Стокса - М.: Успехи физических наук. 1955. 77-110с.

2. Савенков С. Н., Климов А. С., Оберомок Е. А., Осов-ский С. А. Оптимизация измерения матрицы Мюллера с использованием обобщенного временного подхода - Днепропетровск: Вестник Днепропетровского

университета. Серия «Физика. Радиоэлектро-ника».2008. Выпуск 15. 23-29с.

3. Басс Ф. Г. , Фукс И. М. Рассеяние волн на статистически неровной поверхности - М.: Наука, 1972. 424с.

4. Таганов А.И. Методы идентификации, анализа и сокращения проектных рисков качества программных изделий в условиях нечеткости // Информационные технологии. 2011. № 9. С. 22-27.

5. Таганов А.И. Методика анализа и сокращения рисков проектов сложных программных систем по характеристикам качества // Вестник рязанского государственного радиотехнического университета. - Рязань, 2010. - Вып. 31. - С. 77-82.

6. Таганов А.И., Гильман Д.В. Задачи и методы нечеткого управления рисками программного проекта // Системы управления и информационные технологии. - Москва-Воронеж, 2012. - №2(48). - С. 79-83.

АВТОМАТИЧЕСКОЕ ИЗВЛЕЧЕНИЕ ИНФОРМАТИВНЫХ ПРИЗНАКОВ В ЗАДАЧЕ РАСПОЗНАВАНИЯ СОСТОЯНИЯ ДИСТАНЦИОННОГО СТУДЕНТА

Брестер Кристина Юрьевна1 Вишневская Софья Романовна2

1Аспирант, СибГАУ, г. Красноярск 2Канд. техн. наук, зав. кафедры высшей математики, СибГАУ, г. Красноярск

Долгое время формат дистанционного образования (ДО) был чужд как профессорско-преподавательскому составу высших учебных заведений России, так и самим студентам. Однако на сегодняшний день едва ли не у каждого университета имеется возможность предоставления образовательных услуг в дистанционном режиме. Ныне сфера ДО поражает сложностью своей инфраструктуры, количеством студентов и образовательных учреждений.

Положительными аспектами данной формы обучения являются:

- индивидуальный режим занятий, персональное расписание; возможность выполнения заданий в удобном месте и темпе;

- ДО совместимо с основной профессиональной деятельностью;

- использование современных технологий в качестве основного инструмента приобщает обучающихся к достижениям информатики, повышая умения и навыки владения компьютерной техникой;

- ДО оказывает позитивное влияние на самоорганизацию студента;

- разнообразие доступных источников учебной информации (электронные библиотеки, банки данных и прочее).

Однако наряду с плюсами данной формы образования можно выделить ряд существенных недостатков. Так, например, одним из ключевых вопросов, требующих разработки инновационных решений, является несостоятельность «человеко-машинных» интерфейсов. Современные диалоговые системы (ДС) не могут обеспечить должного уровня общения на естественном языке, что оказывает

негативное влияние на развитие коммуникативных компетенций студентов. Поэтому учеными активно разрабатываются подходы для интеллектуализации существующих систем с целью адаптации применяемых технологий под конкретного студента. Автоматическое формирование ответов ДС с учетом персональных характеристик обучающегося (пол, возраст, уровень образование и прочее) является одним из важнейших аспектов интеллектуализации ДС. Кроме того, для повышения качества «человеко-машинных» коммуникаций необходима ориентация на текущее психоэмоциональное состояние студента (усталость, раздраженность, скука, радость и т.п.)

В данной работе рассматривается подход, в рамках которого осуществляется распознавание эмоций обучающегося по речи на основе акустических характеристик звукового сигнала. Предложенная процедура может быть использована в качестве алгоритмического ядра интеллектуальных модулей ДС, функционирующих в сфере ДО.

Извлекаемые из речевого сигнала акустические характеристики представляют собой выборочные данные, на основе которых происходит настройка используемой классификационной модели (обучение с учителем). Однако число таких признаков может быть достаточно велико (сотни или даже тысячи). Поэтому важной задачей является определение подсистемы релевантных атрибутов с целью сокращения размерности используемых данных, а также повышения качества классификации (признаки могут содержать зашумленные данные, коррелировать друг с другом или иметь низкий уровень вариации).

Построение формальной модели отбора информативных признаков сопряжено с выбором критериев, описывающих качество извлеченной подсистемы атрибутов

[11]. В рамках разрабатываемого подхода были использованы внутри- (англ. Intra-class distance (IA)) и межклассовое расстояния (англ. Inter-class distance (IE)) [15]:

1 k nr r IA = -£ £ d(pj,pr) ^ min, (1)

nr=1 j=1 j 1 k

IE = —£ nrd(pr,p) ^ max, (2) nr=1

r

где p j - j-ыи экземпляр класса r, p - центральный при-

мер

набора данных, ..)обозначает евклидову

мет-

рику, pr и Пг соответствуют центральному примеру

класса r и числу экземпляров в нем.

Для решения описанной задачи многокритериальной оптимизации был выбран адаптивный генетический алгоритм (ГА), реализующий метод Strength Pareto Evolutionary Algorithm (SPEA) (Zitzler and Thiele, 1999) [16]. Механизм работы и исследование эффективности модификации алгоритма SPEA с автоматическим выбором типов генетических операторов [1][7] (на основе самоконфигурирования скрещивания [13] и самонастройки мутации [6]) представлен в работе [3]. Выбор данной оптимизационной процедуры обусловлен простотой представления решения: 1 - информативный признак, 0 - неинформативный [4].

Результатом работы многокритериального ГА является множество несравнимых между собой решений: после завершения работы алгоритма для каждой бинарной

строки получаем сокращенную подсистему признаков, используемых в дальнейшем для обучения классификатора. В свою очередь, финальное решение о принадлежности объекта к тому или иному классу принимается ансамблем классификаторов по правилу большинства [14].

Эффективность описанного эвристического подхода для отбора информативных признаков была исследована в сочетании со следующими классификационными моделями:

• полносвязный персептрон (англ. Multilayer Perceptron, сокр. MLP) с одним скрытым слоем;

• машины опорных векторов (англ. Support Vector Machine, сокр. SVM);

• радиально-базисная нейронная сеть с функцией Гаусса (англ. Radial Basis Function Network, сокр. RBF);

• наивный Байесовский классификатор (англ. Naive Bayes);

• деревья решений, для построения которых использовался алгоритм J48 (модификация метода C4.5). В ходе тестирования были использованы реализации данных алгоритмов в программной системе Weka 3.6.10 [9].

Решаемые задачи были представлены базами данных «Berlin» [5], «SAVEE» [10] и «LEGO» [12], содержащими голосовые записи на немецком, английском и английском языках, соответственно (таблица 1). Извлечение акустических характеристик из речевых сигналов производилось с помощью программной системы OpenSMILE [8], в результате чего для каждого образца было получено 384 признака.

Таблица 1.

Описание используемых баз данных_

Название базы данных Язык Объем базы данных Классы

Berlin немецкий 535 Нейтрально, злость, страх, счастье, грусть, скука, отвращение

SAVEE (Surrey Audio-Visual Expressed Emotion) английский 480 Злость, отвращение, страх, счастье, грусть, удивление, нейтрально

LEGO английский 4827 Нейтрально, злость, тишина/шум

Эффективность работы классификаторов сравнивалась на полном и сокращенном наборе признаков с помощью процедуры кросс-валидации (6 стратифицированных частей). Во всех экспериментах ГА предоставлялось одинаковое количество ресурсов: 100 индивидов и 100 поколений. Также были установлены следующие значения для настраиваемых параметров: размер внешнего множества -30, время адаптации - 5 поколений, размер штрафа - 10 индивидов и «социальная карта» - 10 индивидов. Для

оценки точности полученных результатов использовалась агрегированная метрика F_score, включающая в себя два критерия: точность и полноту классификации. Чем ближе значение F_score к 100%, тем качество распознавания выше. Усредненные результаты тестирования предлагаемого подхода на множестве указанных задач с полным и сокращенным набором признаков представлены на рисунке 1.

Berlin

90 80 70 „, 60 S 50 12} 40 30 20 10 0

1

MLP SVM RBF h aiveBaye s J 48

■ 384признака 82,87 81,71 68,93 66,91 50,15

■ Сокра щенный набор 82,26 82,14 71,59 67,45 51,96

SAVEE

70 60 50 ф о 40 и J 30 20 10 0

1 1

MLP SVM RBF aiveBaye s J4S

■ 384признэкэ 61,72 59,22 43,27 43,64 42,46

■ Сокращенный набор 63,58 60,77 44,15 45,53 47,79

LEGO

80 70 60 £ 50 о fei, 40 30 20 10 0

MLP SVM RBF aiveBayt s J48

■ 384 признака 67,53 70,81 52,61 57,00 57,55

■ Сокращенным набор 71,70 69,88 61,31 59,43 64,90

Рисунок 1. Результаты тестирования предложенного подхода

Полученные результаты демонстрируют следующее: разработанная методика в большинстве случаев позволяет не только улучшить качество работы классификаторов, но и сократить число атрибутов, необходимых для распознавания эмоционального состояния человека. Так, для базы данных Berlin количество признаков было сокращено в среднем с 384 до 182.2, для SAVEE - до 178.3, для LEGO - до 180.9. В тех случаях, когда применение описанного подхода привело к снижению качества классификации, наблюдаемое ухудшение составило менее 1%.

Таким образом, в данной статье предлагается алгоритм распознавания эмоций человека по речи с автоматическим извлечением информативных признаков адаптивным многокритериальным ГА. Как показывают эксперименты, гибридизация эвристической процедуры отбора релевантных атрибутов и классификаторов (MLP, SVM, RBF и т.д.) приводит к повышению эффективности алгоритмов обучения применяемых моделей. Благодаря механизмам адаптации многокритериального ГА использование данной схемы возможно и человеком, не являющимся экспертом в сфере настройки генетических операторов [2]. Указанные преимущества обуславливают простоту внедрения описанной процедуры в интеллектуальные модули ДС, используемые в качестве аппаратных средств в области ДО.

Список литературы:

1. Сергиенко Р.Б. Исследование эффективности ко-эволюцтонного генетического алгоритма условной оптимизации // Вестник СибГАУ. 2009. №3. С. 3136.

2. Семенкина М.Е. Самоадаптивные эволюционные алгоритмы проектирования информационных технологий интеллектуального анализа данных // Искусственный интеллект и принятие решений. 2013. №1. С. 13-23.

3. Brester Ch. Yu., Semenkin E. S. Development of adaptive genetic algorithms for neural network models multicriteria design // Вестник СибГАУ. 2013. №4 (50). С. 99-103.

4. Brester C., Semenkin E., Sidorov M., Minker W. Self-adaptive multi-objective genetic algorithms for feature selection // Proceedings of International Conference on Engineering and Applied Sciences Optimization (OPT-i'14). 2014. P. 1838-1846.

5. Burkhardt F., Paeschke A., Rolfes M., Sendlmeier W. F., and Weiss B. A database of german emotional speech // In Interspeech. 2005. P. 1517-1520.

6. Daridi F., Kharma N., and Salik, J. Parameterless genetic algorithms: review and innovation // IEEE Canadian Review, (47). 2004. P. 19-23.

7. Eiben A.E., Hinterding R., and Michalewicz Z. Parameter control in evolutionary algorithms // IEEE Transactions on Evolutionary Computation, 3(2), 1999. P. 124-141.

8. Eyben F., Wöllmer M., and Schuller B. Opensmile: the munich versatile and fast opensource audio feature extractor // Proceedings of the international conference on Multimedia, 2010. ACM. P. 1459-1462.

9. Hall M., Frank E., Holmes G., Pfahringer B., Reutemann P., Witten I. H. The WEKA Data Mining Software: An Update, SIGKDD Explorations, vol. 11, issue 1, 2009.

10. Haq S., Jackson P. Machine Audition: Principles, Algorithms and Systems, chapter Multimodal Emotion Recognition // IGI Global, Hershey PA. Aug. 2010. P. 398-423.

11. Kohavi R., John G. H. Wrappers for feature subset selection // Artificial Intelligence, 97. 1997. P. 273-324.

12. Schmitt A., Ultes S., and Minker W. A parameterized and annotated corpus of the cmu let's go bus information system // In International Conference on

Language Resources and Evaluation (LREC). 2012.

13. Semenkin E., Semenkina M. Self-configuring Genetic Algorithm with Modified Uniform Crossover Operator // Advances in Swarm Intelligence. - Lecture Notes in Computer Science 7331. - Springer-Verlag, Berlin Heidelberg, 2012. P. 414-421.

14. Sidorov M., Brester C., Semenkin E., Minker W. Speaker State Recognition with Neural Network-based Classification and Self-adaptive Heuristic Feature Selection // Proceedings of the 11th International Conference on Informatics in Control, Automation and

Robotics (ICINCO'2014). 2014, vol. 1. P. 699-703.

15. Venkatadri M., Srinivasa Rao K. A multiobjective genetic algorithm for feature selection in data mining // International Journal of Computer Science and Information Technologies, 2010. Vol. 1, no. 5. P. 443448.

16. Zitzler, E., Thiele, L. Multiobjective evolutionary algorithms: A comparative case study and the strength pareto approach // Evolutionary Computation, IEEE Transactions on, 1999. Vol. 3, no. 4. P. 257-271.

ИСПОЛЬЗОВАНИЕ КОРНЯ ЛОПУХА В ПРИЗВОДСТВЕ ФУНКЦИОНАЛЬНЫХ

НАПИТКОВ

Чеснокова Наталья Юрьевна

Канд.биол наук, доцент кафедры технологии продукции и организации общественного питания Школы биомедицины

ДВФУ, г. Владивосток Кузнецова Алла Алексеевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Канд.тех наук, доцент кафедры технологии продукции и организации общественного питания Школы биомедицины

ДВФУ, г. Владивосток Левочкина Людмила Владимировна

Канд.тех наук, доцент кафедры технологии продукции и организации общественного питания Школы биомедицины

ДВФУ, г. Владивосток

Сегодня потребители хотят быть уверенными, что помимо замечательного вкуса, получат от продукта максимум дополнительной пользы. В результате на полках магазинов появились функциональные напитки, призванные удовлетворить запросы тех, кто придерживается здорового образа жизни.

В зарубежной практике в категории функциональных напитков выделяют четыре основные группы: спортивные, энергетические, здоровые и нутрицевтики.

В своей работе мы рассматривали напитки, которые можно отнести к группе здоровые. Здоровые напитки предназначены для массового потребления и являются наиболее популярными функциональными напитками. Эти напитки обогащены витаминами, минералами, ненасыщенными жирными кислотами и пищевыми волокнами, которые способствуют предупреждению заболеваний сердечно-сосудистой системы, желудочно-кишечного тракта, онкологических и других болезней.

Одними из источников функциональных ингредиентов, а именно пищевых волокон, биологически-активных соединений, витаминов и минеральных веществ, признаны дикорастущие растения. Одним из таких дикорастущих растений является лопух. Лопух давно и широко применяется в народной медицине, как в свежем виде, так и в виде отваров.

В России произрастает 6-8 видов лопуха, в Приморье - 3 вида: лопух большой, лопух малый и лопух войлочный. Химический состав лопуха уже достаточно изучен. В корнях растения содержится до 15,4% белка, 1,5% жира, 22,3% клетчатки, эфирное масло, пальмитиновая, стеариновая кислоты. Кроме того, в корнях растения содержится до 45% полисахарида инулина, восстанавливающего работу органов пищеварительной системы. Инулин, подвергнутый кислотному гидролизу, является источником фруктозы, что чрезвычайно важно в питании людей больных сахарным диабетом, заболеванием, прогрессирующим в последние годы среди населения России.

В работе для исследования был использован сушеный корень лопуха большого (Arctium lappa), произрастающий в Приморском крае.

Так как при расщеплении инулина образуется фруктоза, которая позволяет заменить часть сахара, добавляемого в продукт, то с этой целью в работе был проведен гидролиз инулина, содержащегося в корне лопуха. Перед проведением гидролиза сушеные корни растения подвергались предварительному измельчению. Гидролиз инулина проводили в присутствии 6%-ой лимонной, 6%-ой уксусной и 6%-ой аскорбиновой кислот при температуре 75 0С в течение 60 мин. Для качественной оценки процесса гидролиза инулина была проведена нафторезор-циновая проба Толленса, характеризующая наличие продукта реакции - фруктозы [1, с. 41]. Содержание фруктозы в растворах, подвергшихся гидролизу, определенное спек-трофотометрически при длине волны 800 нм представлено на рисунке 1.

По результатам измерений было определено, что наибольшая концентрация сахаров наблюдается в образце с 6%-ой аскорбиновой кислотой.

Анализируя полученные результаты, было решено использовать в качестве добавки к кофейному напитку продукт, в котором содержится аскорбиновая кислота в большом количестве. Таким продуктом был выбран имбирь, так как в нем содержание аскорбиновой кислоты составляет 12 мг на 100 г измельченного продукта. Поэтому было решено приготовить кофейный напиток на основе корня лопуха с добавлением имбиря. Кроме того, корень имбиря содержит много ценных компонентов, в частности аспарагин, холин, линолиевую, каприловую и олеиновую кислоты, эфирное масло, витамины Bi, В2, В3, насыщенный минеральный комплекс (кремний, алюминий, цинк, натрий, фосфор, железо, марганец, калий, магний и др.).

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Брестер Кристина Юрьевна, Вишневская Софья Романовна

Текст научной работы на тему «Автоматическое извлечение информативных признаков в задаче распознавания состояния дистанционного студента»