Научная статья на тему 'СИСТЕМА РАСПОЗНАВАНИЯ ЭМОЦИЙ ПО ВЫРАЖЕНИЮ ЛИЦА С ЛОКАЛИЗАЦИЕЙ НА ПОРТУГАЛЬСКОМ, АНГЛИЙСКОМ, РУССКОМ ЯЗЫКАХ И ЯЗЫКЕ УМБУНДУ'

СИСТЕМА РАСПОЗНАВАНИЯ ЭМОЦИЙ ПО ВЫРАЖЕНИЮ ЛИЦА С ЛОКАЛИЗАЦИЕЙ НА ПОРТУГАЛЬСКОМ, АНГЛИЙСКОМ, РУССКОМ ЯЗЫКАХ И ЯЗЫКЕ УМБУНДУ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
98
29
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
выражение лица / эмоция / модель / глубокая сверточная нейронная сеть (DCNN) / СОО / facial expression / emotion / model / deep convolutional neural network (DCNN) / COO

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Г.М. Сома, Н.В. Кондрашова

В статье предложена новая система распознавания эмоций, основанная на выражениях лица и их описаниях на четырех языках – русском, английском, португальском и умбунду. Значительную роль в определении истинных намерений осуществления коммуникативного акта в разных видах практической деятельности наряду с традиционной вербальной коммуникацией играют эмоции. Существует большое количество систем распознавания эмоций, которые способны распределять человеческие эмоции по классам и использовать их для контроля коммуникативного акта. Известные системы наделены низкой точностью валидации, большим размерам и длительным временем выполнения, а также не имеют локализации эмоций для определенной страны или региона, говорящего на португальском, русском и умбунду. Для распознавания эмоций построен классификатор, использующий метод машинного обучения, реализованный в библиотеке Keras, и создана новая архитектура классификатора глубокой сверточной нейронной сети (DCNN). Обучение классификатора проведено на выборке данных FER 2013. Проведено сравнение двух обученных моделей для распознавания эмоций: базовая модель и разработанная нами модель. Согласно экспериментальным данным, разработанная нами модель достигла лучших результатов по точности валидации (70,41%), времени выполнения (0,00043 сек.), и размеру (12,7 МБ). Установлены наиболее адекватные переводческие соответствия данных единиц для того, чтобы разработанная нами система распознавания эмоций предоставляла информацию об эмоциональном состоянии клиентов в системах общественного обслуживания (СОО) согласно языковой ситуации этой страны или региона. Система обеспечивает перевод эмоций на португальский, английский, русский и традиционный язык умбунду с целью получения информации о клиентах и минимизировать конфликты в системах общественного обслуживания.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Г.М. Сома, Н.В. Кондрашова

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FACIAL EMOTION RECOGNITION SYSTEM WITH LOCALIZATION IN PORTUGUESE, ENGLISH, RUSSIAN AND UMBUNDU

The article proposes a new emotion recognition system based on facial expressions and their descriptions in four languages – Russian, English, Portuguese and Umbundu. Emotions play a significant role in determining the true intentions of the implementation of a communicative act in various types of practical activities, along with traditional verbal communication. There are a large number of emotion recognition systems that are able to recognize human emotions by class and use them to control a communicative act. The known systems have low validation accuracy, large size and long execution time, and also do not have localization of emotions for a specific country or region speaking Portuguese, Russian and Umbundu. For emotion recognition, a classifier using the machine learning method implemented in the Keras library has been built, and a new deep convolutional neural network (DCNN) classifier architecture has been created. The training of the classifier was carried out on a sample of FER 2013 data. Two trained models for emotion recognition were compared: the basic model and the model developed by us. According to experimental data, the model we developed achieved the best results in validation accuracy (70.41%), execution time (0.00043 s), and size (12.7 MB). The most adequate translation correspondences of these units have been established in order for the emotion recognition system developed by us to provide information about the emotional state of customers in public service systems according to the language situation of this country or region. The system provides translation of emotions into Portuguese, English, Russian and the traditional Umbundu language in order to obtain information about customers and minimize conflicts in public service systems.

Текст научной работы на тему «СИСТЕМА РАСПОЗНАВАНИЯ ЭМОЦИЙ ПО ВЫРАЖЕНИЮ ЛИЦА С ЛОКАЛИЗАЦИЕЙ НА ПОРТУГАЛЬСКОМ, АНГЛИЙСКОМ, РУССКОМ ЯЗЫКАХ И ЯЗЫКЕ УМБУНДУ»

24. Kirillova E.O. Oriental'nye temy, obrazy, motivy v literature russkogo zarubezh'ya Dal'nego Vostoka (B.M. Yul'skij, N.A. Bajkov, M.V. Scherbakov, E.E. Yashnov). Vladivostok: Dal'nevostochnyj federal'nyj universitet, 2015.

25. Bajkov N.A. Velikij Van: povest'; Chernyj kapitan: roman. Vladivostok: Al'manah «Rubezh», 2009.

26. Bajkov N.A. Zapiski man'chzhurskogo ohotnika. Tyan'czin: Knigoizdatel'stvo «Nashe znanie», 1941.

27. Bajkov N.A. Dan' Velikomu Vanu. Avstraliada. 2003; № 34: 43-45.

28. Scherbakov M.V. Odissei bez Itaki: povest', rasskazy, ocherki, stihi, perevody. Vladivostok: Rubezh, 2011.

29. Bajkov N.A. V gorah i lesah Man'chzhurii: ocherki; Tigrica: povest'. Vladivostok: Rubezh, 2011.

30. Bajkov N.A. Tajga shumit; Po belu svetu; U kostra; Skazochnaya byl': ocherki irasskazy. Vladivostok: Rubezh, 2012.

31. Ershov D.V. Hunhuzy. Neob'yavlennaya vojna. 'Etnicheskij banditizm na Dal'nem Vostoke. Moskva, 2010.

32. Kirillova E.O. Tvorchestvo pisatelya dal'nevostochnoj 'emigracii N.A. Bajkova kak primer kul'turnogo vzaimodejstviya v usloviyah transgranich'ya. Regional'nyj obraz svyaschennogo dereva. Vestnik Cherepoveckogo gosudarstvennogo universiteta. 2016; № 4 (73): 92-98.

Статья поступила в редакцию 20.02.23

УДК 004.021

Soma G.M., postgraduate, ITMO University (St. Petersburg, Russia), E-mail: guedes.soma@mail.ru

Kondrashova N.V., Cand. of Sciences (Pedagogy), senior lecturer, ITMO University (St. Petersburg, Russia), E-mail: nvkondrashova@itmo.ru

FACIAL EMOTION RECOGNITION SYSTEM WITH LOCALIZATION IN PORTUGUESE, ENGLISH, RUSSIAN AND UMBUNDU. The article proposes a new emotion recognition system based on facial expressions and their descriptions in four languages - Russian, English, Portuguese and Umbundu. Emotions play a significant role in determining the true intentions of the implementation of a communicative act in various types of practical activities, along with traditional verbal communication. There are a large number of emotion recognition systems that are able to recognize human emotions by class and use them to control a communicative act. The known systems have low validation accuracy, large size and long execution time, and also do not have localization of emotions for a specific country or region speaking Portuguese, Russian and Umbundu. For emotion recognition, a classifier using the machine learning method implemented in the Keras library has been built, and a new deep convolutional neural network (DCNN) classifier architecture has been created. The training of the classifier was carried out on a sample of FER 2013 data. Two trained models for emotion recognition were compared: the basic model and the model developed by us. According to experimental data, the model we developed achieved the best results in validation accuracy (70.41%), execution time (0.00043 s), and size (12.7 MB). The most adequate translation correspondences of these units have been established in order for the emotion recognition system developed by us to provide information about the emotional state of customers in public service systems according to the language situation of this country or region. The system provides translation of emotions into Portuguese, English, Russian and the traditional Umbundu language in order to obtain information about customers and minimize conflicts in public service systems.

Key words: facial expression, emotion, model, deep convolutional neural network (DCNN), COO

Г.М. Сома, аспирант, ФГАОУ ВО «Национальный исследовательский университет ИТМО», г. Санкт-Петербург, E-mail: guedes.soma@mail.ru

Н.В. Кондрашоеа, канд. пед. наук, доц., ФГАОУ ВО «Национальный исследовательский университет ИТМО», г. Санкт-Петербург,

E-mail: nvkondrashova@itmo.ru

СИСТЕМА РАСПОЗНАВАНИЯ ЭМОЦИЙ ПО ВЫРАЖЕНИЮ ЛИЦА С ЛОКАЛИЗАЦИЕЙ НА ПОРТУГАЛЬСКОМ, АНГЛИЙСКОМ, РУССКОМ ЯЗЫКАХ И ЯЗЫКЕ УМБУНДУ

В статье предложена новая система распознавания эмоций, основанная на выражениях лица и их описаниях на четырех языках - русском, английском, португальском и умбунду. Значительную роль в определении истинных намерений осуществления коммуникативного акта в разных видах практической деятельности наряду с традиционной вербальной коммуникацией играют эмоции. Существует большое количество систем распознавания эмоций, которые способны распределять человеческие эмоции по классам и использовать их для контроля коммуникативного акта. Известные системы наделены низкой точностью валидации, большим размерам и длительным временем выполнения, а также не имеют локализации эмоций для определенной страны или региона, говорящего на португальском, русском и умбунду. Для распознавания эмоций построен классификатор, использующий метод машинного обучения, реализованный в библиотеке Keras, и создана новая архитектура классификатора глубокой сверточной нейронной сети (DCNN). Обучение классификатора проведено на выборке данных FER 2013. Проведено сравнение двух обученных моделей для распознавания эмоций: базовая модель и разработанная нами модель. Согласно экспериментальным данным, разработанная нами модель достигла лучших результатов по точности валидации (70,41%), времени выполнения (0,00043 сек.), и размеру (12,7 МБ). Установлены наиболее адекватные переводческие соответствия данных единиц для того, чтобы разработанная нами система распознавания эмоций предоставляла информацию об эмоциональном состоянии клиентов в системах общественного обслуживания (СОО) согласно языковой ситуации этой страны или региона. Система обеспечивает перевод эмоций на португальский, английский, русский и традиционный язык умбунду с целью получения информации о клиентах и минимизировать конфликты в системах общественного обслуживания.

Ключевые слова: выражение лица, эмоция, модель, глубокая сверточная нейронная сеть (DCNN), СОО

В связи с тем, что эмоциональный настрой человека является основой его дальнейшего поведения, следует отметить, что распознавание эмоций должно применяться в местах массового скопления людей и системах общественного обслуживания (СОО), таких как системы контроля доступа в банках, аэропортах, метро, колл-центрах, МФЦ, магазинах и т. д. Кроме того, в СОО наблюдается рост числа эмоциональных и психических отклонений у клиентов [1], нуждающихся в скорейшей идентификации на языке текущего региона, чтобы можно было принять автоматизированные решения о распределение этих клиентов к определенному сотруднику. Только используя современные результаты научно-технического прогресса, можно помочь быстро решить эту проблему. Большинство имеющихся ресурсов не находятся в открытом доступе, что усложняет процесс исследования в целом. Соответственно, имеется потребность в создании программ и программных комплексов, автоматически контролирующих эмоциональное состояние людей и позволяющих быстро принимать решения без помощи человека. Новизна исследования заключается в том, что нами разработана система распознавания самых важных с точки зрения общественной безопасности эмоций на основе визуального канала (техника, позволяющая распознавать состояние человека по выражению его лица). Кроме того, хотя проводимое нами исследование выполнено на русском языке, для того чтобы наша система правильно и эффективно работала

в других странах, необходимо установить однозначные переводы идентифицированных эмоций на другие языки. Актуальность данного исследования была обусловлена необходимостью распознавания эмоций клиента по выражению лица и выводить их описания на экран оператора в печатном виде на четырех языках из разных стран или регионов с различными национальными и культурными особенностями, а также недостаточностью существующих механизмов для преодоления конфликтов.

На данный момент существует значительное количество моделей, которые могут автоматически распознавать эмоции человека по выражению лица. Однако качество этих систем распознавания эмоций низкое из-за ряда проблем [2; 3], таких как:

1. Некорректная построенная архитектура нейронной сети.

2. Малое количество данных для обучения и тестирования.

3. Внутриклассовые различия и межклассовое сходство.

4. Наличие фиктивных эмоций.

5. Низкий уровень освещенности.

6. Различные углы поворота головы.

7. Различия в пропорциях лица.

В соответствии с вышеперечисленными проблемами, была сформулирована гипотеза для разработки системы, которая может лучше распознавать

эмоциональное состояние клиентов в СОО и описывать эти эмоции на четырёх различных языках для лучшей интерпретации.

Цель работы - разработать систему для улучшения качества обслуживания клиентов в системах общественного обслуживания. Для достижения поставленной цели было необходимо решить следующиезадачи :

1. Разработка архитектуры глубокой сверточной нейронной сети.

2. Применение наборов данных с большой выборкой для обучения и тестирования.

3. Применение метода машинного обучения для обучения моделей.

4. Использование высококачественной аппаратуры.

5. Установление степени равнозначности лексем, включаемых в поле «эмоция», в русском, португальском, английском языках и яз ыке умбунду и разработка системы их переводческих соответствий.

Обзор систем распознавания человеческих эмоций

Эмоции занимают важное место в жизни каждого человека. Их влияние на членов общества происходит в различных сферах как при взаимодействии людей друг с другом, так и при принятии человеком того или ин го решения.

Системы распознавания человеческих эмоций по лица м содержат основные этапы [2]:

- предварительная обработка изображений;

- извлечение признаков;

- классификация эмоций.

Предварительная обработка изображений позволяет решитьтакиепробле-мы, как отсутствие данных о выражении лица, внутри- и межклассовое сходство, незначительные перемены в облике лица, изме невиеполеждзия головы,сввт: при решении которых возможно улучшить точность систем распознавания выражения лица.

Предобработка изображений может содержать сеедаю щиедгапы:

1) нахождение области лица;

2) обрезание и масштабирование найденной области лица :

3) выравнивание лица;

4) коррекция контраста.

1.1 Нахождение области лица дает возможность определить рзаме|зизок ложение лица на изображении. Самые распространенные методы нахождения:

- метод Виола-Джонса [4];

- многобоксовый детектор с одним выстрелом (SSD) [5];

- обнаружение объектов с максимальным запасом [6];

- гистограмма ориентированных градиентвв[0;

К примеру, применение методов Виола-Джонса и SSD представлено в ряде работ [8; 9].

2.1 Обрезание и масштабирование найденной области лица выполняется в соответствии с координатами, полученными методами нахождении области лица

Поскольку найденные области лица имеют разные размеры, требуется выполнить масштабирование изображений, то есть привести все изображения к одному разрешению. Для таких задач применимы:

- коррекция Бесселя [10];

- гауссово распределение;

Применение этих методов представлено в трудах различных авторов [11; 12].

1.1 Выравнивание лица уменьшает внутриклассовую разницу

Например, по каждому выражению лица выбирается опорное изображение, выделенное цветовыми компонентами или самыми информативными областями лица (в частности, глаза, лоб), а оставшиеся изображения упорядочиваются по отношению к опорным изображениям. Для решения этой задачи применяются методы:

- масштабно-инвариантное преобразование объектов [13];

- область интереса (ROI) [14].

Примеры применения этих методов описаны в ряде работ [15; 16].

4.1 Коррекция контраста позволяет смягчить изображения, снизить шум, увеличить контрастность лица и повысить насыщенность, например, для решения проблем с освещением

Методы коррекции (регулировки) контрастности следующие:

- гистограммное выравнивание [17];

- линейная контрастная растяжка [18];

Использование этих методов представлено в работе Oloyede M., Hancke G., Myburgh H., Onumanyi A. [19].

Извлечение визуальных признаков базируется на применении геометрии и внешнего вида лица, по которым осуществляется поиск ключевых точек выделенных особенностей (элементов). Геометрия относится к элементам лица (их форме и расположению), таким как нос, глаза, рот, губы и т. д. При этом, как правило,

определение формы лицевых элементов происходит по ключевым точкам. Так, на рис. 1 изображенытакие точки для рта, тоса, глазаиброией[20]. Внешний вид лица включает форму и текстуру кожи. Классификация признаков, извлеченных из выражений лица, выполняется с помощью методов нейронных сетей традици-оннййимаоннноИм асииЫвквоии.

Рис.1. Основныемючевые точкина лице (Landmarks)[3] Fig. 1. Principal Key Points on the Face (Landmarks) [3]

В данном исследовании был применен метод машинного обучения с использованием библиотек Keras и TensorFlow. Для распознавания эмоций требуются аиалцз вираженай лица, в хюде которогосчавитсязадаиарцшить трчос-новные задачи:

1.Распозн авааиелца.

2. Извлечение признаков.

3. Классификация выражений лица по неподвижным или последователь-иымизоб|зажаниям (цюс. 1,

4. Печать распознанной эмоции на четырех языках.

Расиотна вание лиц. На этом этапе система захватывает кадры с помощью глубокой нейронной сети через визуальный канал.

Извлечение признаков. Выполняется следующим образом:

-зцхаотчадоа;

- определение местоположения области лица клиента в кадре;

е обиееацизэтойо&исти;

- изменение размера кадра до 48 x 48.

Классификация изображений. Для распознавания эмоций была разработа-нам одель на основе DCNN (глубокой сверточной нейронной сети), которая классифицирует лица на 4 класса (гнев, радость, грусть и нейтральное состояние). Вчкоцам модели явсяотся четтра зиачснея,котореберодатанляют собой вероятности принадлежности к каждому классу. Мы относим изображение к классу с наибольшей вероятностью.

Для оценки качества классификатора, разработанного на основе DCNN, мы использовали функцию classification_report из библиотеки sklearn. В нем существует три основных метрики, которые применяются для оценки качества нашей модели:

- точность (Precision): процент правильных положительных прогнозов относительно общего количества положительных прогнозов;

- отзыв (Recall): процент правильных положительных прогнозов относительно общего фактического положительного результата;

- значение F1 (F1-score): взвешенное среднее гармоническое значение точности и отзыва. Чем ближе к 1, тем лучше модель.

F1 Score: 2 * (Precision * Recall) / (Precision + Recall).

Используя эти три показателя, мы можем понять, насколько хорошо наша модель классификации способна прогнозировать результаты.

По главным параметрам (табл. 1): размер модели; время выполнения - измерено на процессоре NVIDIA «Tesla P100-PCIE» GPU; потери являются значением функции потерь, которая применяется для оценки качества решений, принятых при обучении модели. Модель сводится к минимуму в каждом обучении. Тренировка представляет собой процесс обучения нейронной сети (НС), в котором веса сети изменяются методом градиентного спуска, для каждой итерации минимизируя функцию потерь.

Полученные результаты показывают (табл. 1), что из двух классификаторов эмоций разработанная нами модель имеет лучшую точность валидации (70,41%), чем модель 2 с точностью валидации (63%). Наша модель имеет низкое время выполнения: (0,00043 сек.) и размер (12,7 МБ), (0,001 сек.) и размер (15,49 МБ) для модели 2.

По представленным графикам на (рис. 2) наблюдается хороший результат: в процессе обучения разработанного классификатора на основе DCNN функция потерь уменьшается на 0,4954, а точность увеличивается до 83,21%.

Таблица 1

Модель Размер модели, МБ Время выполнения, сек. Точность тренировки, % Точность валидации, %

Разработанная модель 12,7 0,00043 83,21 70,41

Model [2] 15,49 0,001 97,30 60,13

Результаты тестирования моделей классификации

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0,9

0,8

0,7

Т 0,6

0,5

оч 0,4

S 0,3

0,2

0,1

0

13 5 7

Точность тренировки Точность валидации

9 11 13 15 17 19 21 23 25 27

Эпохи

п

1I

Потеря тренертвки Потеря валидации

13 5 7 9 111315171921232527293133

Эпохи

1,2

1

0,8

Т 0,6

1ч 0,4

S 0,2

0

Точность тренировки Точность валидации 1 3 5 7 9 11 13 15 1719 21 23 25 27

Эпохи

п

1I

5 4 3 2 1 О

Потеря валидации Потеря "фенеровки

1 3 5 7 9 11 13 15 17 19 21 23 25

Э п опей

Рис. 2. Обучение и тестирование потерь и точности: разработанная модель (a, b); модель [2] (c, d) Fig. 2. Loss and accuracy training andtesting: de^e^^c^p^ed model (n,ln);modвЦ2] (cp d)

Заметим, что в полученных текстовых отчетах по основным показателям разработанной модели (табл. 2) представлена точность, значение ^показателя recall, значение f1 количества изображений для каждого класса (support), а также macro avg и weighted ауддля всехмассос.

Precision Recall F1-score Support

Anger 0,76 0,46 0,57 960

Happiness 0,83 0,88 0.86 1825

Neutral 0,58 0,68 0.63 1216

Sadness 0,59 0,62 0,60 1139

Accuracy 0,70 5140

Macro avg 0,69 0,66 0,66 5140

Weighted avg 0,70 0,70 0,69 5140

о =

S

¡5

£

гнев 439 52 66 94

радость 57 1269 114 48

нейтральное 102 80 571 166

грусть 177 100 204 677

гнев радость нейтральное грусть Истинное

Как показано на рис. 3, разработанная модель показала хорошие результаты по невзвешенному среднему показателю (Unweighted Average Recall, UAR), согласно полученным матрицам спутывания. Матрица спутывания позволяет нам понять производительность классификатора с помощью табл. В матрице спутывания строки соответствуют фактическим меткам, а столбцы - предсказанным меткам. Диагональ (жирный шрифт) показывает правильно классифицированные образцы, а стандартные текстовые цифры - неправильно классифицированные образцы.

Система переводческих соответствий лексем, включаемых в поле «эмоция», в русском, португальском, английском языках и языке умбунду

Как видно на рис. 3, в нашей системе учитывались семь базовых эмоций: радость, гнев, страх, удивление, отвращение, грусть и нейтральное состояние (отсутствие эмоций).

По смысловой структуре слово «радость» на русском языке обозначает веселье, т. е. чувство, которое выражается внешне. Возможные варианты - в португальском языке слово «felicidade», в языке умбунду «Essandju» и в английском «joy» - понимаются как чувство, которое может не выражаться внешними проявлениями, находящееся «глубоко внутри» человека, «внутренний покой и удовлетворенность». Следовательно, более адекватным переводческим вариантом в

Рис. 3. Матрица спутывания разработанной модели (a) и модель [2] (b)

b

d

c

целях распознавания эмоций по визуальному каналу в английском будет слово «happiness», которое толкуется как «внешнее проявление восторга», в португальском - alegria, на умбунду - sanjuisa.

Слова «гнев», «страх», «удивление», «грусть» имеют одинаковые значения в четырех языках. Так, русское «гнев», португальское «ira», английское «аnger» и слово на языке умбунду «ó nhengo» понимаются как «негодование, чувство сильного возмущения».

«Страх» - в португальском «medo», в английском «fear» и на умбунду -«ussumba» - это эмоциональное состояние, возникающее в результате осознания опасности или угрозы.

«Удивление» - в португальском - «surpresa», в английском - «surprise» и на умбунду «oku likondoveka» - означает действие или эффект неожиданности.

Русское слово «грусть», португальское «tristeza», английское «sadness» и на умбунду «esumue» определяется как негативная эмоция. Она возникает, когда человек испытывает значительную неудовлетворенность каким-либо аспектом своей жизни.

Нейтральное состояние в португальском обозначается «neutro», в английском - «neutral» и на умбунду - «Latchimue» и понимается как отсутствие эмоций. Это самое трудное для выбора переводческого варианта слово, т. к. для выражения этого состояния в русском языке существует целый ряд слов: «равнодушие», «безразличие», «безучастность», «индифферентность», но все они кроме прямого лексического значения отсутствия эмоций несут негативную оценку. В португальском языке мы видим похожую ситуацию: синоним «insensibilidade» обозначает человека бесчувственного, равнодушного, жесткого по отношению к другим, не любящего жизнь, т. е. это слово характеризует человека отрицательно. Следовательно, этот вариант не подходит для нашей цели распознавания эмоций, т. к. нам необходимо установить лишь факт наличия или отсутствия эмоционального фона человека без его оценивания.

Русское слово «отвращение» и английское «disgust» понимаются как сильная форма неприятия, тогда как созвучное английскому слово «desgosto» в португальском и «oluwê» на умбунду выражают скорее,боль, печаль, неудовлетворенность, недовольство, поэтому более подходящим переводческим вариантом в португальском будет «aversâo».

Библиографический список

Результаты данного исследования могут быть использованы в качестве перевода системы распознавания эмоций клиентов в системах общественного обслуживания и в сферах, где имеется общение с большим количеством клиентов, в странах, использующих португальский, английский и русский языки в качестве государственных, а также язык умбунду в качестве национального.

В данном исследовании разработана система распознавания эмоций по выражению лица с локализацией на четырех языках (португальском, английском, русском и умбунду). Две обученные модели были сопоставлены по качеству распознавания эмоций: модель 2 и разработанная нами модель. Согласно полученным результатам, разработанная нами модель обладает наилучшими показателями по точности валидации (70,41%), времени выполнения (0,00043 сек.) и размеру (12,7 МБ). Согласно заявленной выше гипотезе, были созданы архитектуры глубоких сверточных нейронных сетей с лучшей точностью с использованием машинного обучения; для обучения и тестирования нашей модели применен популярный набор данных FER2013, было использовано 19 812 изображений из набора данных. Одна модель была обучена и сравнена с известной моделью 2 с целью определения лучшей модели. Первая и вторая модели обучены на платформе kaggle с использованием глубокой сверточной нейронной сети (DCNN). Результаты этого исследования могут быть применены в системах общественного обслуживания, таких как доступ к магазинам, банкам, супермаркетам, больницам и местам массового скопления людей.

Лексемы, включаемые в лингвокультурное поле «эмоции» в русском, английском, португальском языках и языке умбунду, обладают чертами сходства и различия в смысловой структуре, что является следствием национальных особенностей истории, культуры и языка. Проведенное исследование позволило нам установить наиболее адекватные переводческие соответствия данных единиц с целью обеспечения адаптации разрабатываемой нами системы распознавания лиц к языковой ситуации в разных странах.

В будущем планируется разработать систему, которая не только распознает эмоции клиента по выражению лица, но и автоматически распределяет по маршрутам этих клиентов к нужному оператору в соответствии с их (клиентов) эмоциональным состоянием.

1. Yu-Hua Yan, Tsair-Wei Chien, Yu-Tsen Yeh, Willy Chou, Shu-Chen Hsing. An App for Classifying Personal Mental Illness at Workplace Using Fit Statistics and Convolutional Neural Networks: Survey-Based Quantitative Study. JMIR Mhealth Uhealth. 2020; Vol. 8, № 7.

2. Сома ГМ., Каднова А.М. Распознавание эмоционального состояния человека на основе сверточной нейронной сети. Научно-технический вестник информационных технологий, механики и оптики. 2022; Т. 22, № 1: 120-126.

3. Рюмина Е.В., Карпов А.А. Аналитический обзор методов распознавания эмоций по выражениям лица человека. Научно технический вестник информационных технологий, механики и оптики. 2020; Т. 20, № 2: 163-176.

4. Liu W., Anguelov D., Erhan D., Szegedy C., Reed S., Fu C.-Y., Berg A.C. SSD: single shot multibox detector. Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 2016; Vol. 9905: 21-37.

5. Viola P., Jones M.J. Robust real-time face detection. International Journal of Computer Vision. 2004; Vol. 57, № 2: 137-154.

6. King D.E. Max-margin object detection. Available at: https://arxiv.org/pdf/1502.00046.pdf

7. Deniz O., Bueno G., Salido J., De la Torre F. Face recognition using histograms of oriented gradients. Pattern Recognition Letters. 2011; Vol. 32, № 12: 1598-1603.

8. Александров А.А., Кирпичников А.П., Ляшева С.А., Шлеймович М.П. Анализ эмоционального состояния человека на изображении. Вестник технологического университета. 2019; Т. 22, № 8: 120-123.

9. Voronov V., Strelnikov V., Voronova L., Trunov A., Vovik A. Faces 2D-recognition аnd identification using the HOG descriptors method. FRUCT: Proc. 24th Conference of Open Innovations Association. 2019: 783-789.

10. Mohan P.G., Prakash C., Gangashetty S.V. Bessel transform for image resizing. IWSSIP2011: Proc. 18th International Conference on Systems, Signals and Image Processing. Sarajevo, Bosnia-Herzegovina, 2011: 75-78.

11. Owusu E., Abdulai J.-D., Zhan Y. Face detection based on multilayer feed-forward neural network and Haar features. Software: Practice and Experience. 2019; Vol. 49, № 1: 120-129.

12. Su J., Gao L., Li W., Xia Y., Cao N., Wang R. Fast face tracking-bydetection algorithm for secure monitoring. Applied Sciences. 2019; Vol. 9, № 18: 3774.

13. Lowe D.G. Distinctive image features from scale-invariant keypoints. International Journal of Computer Vision. 2004; Vol. 60, № 2: 91-110.

14. Hernandez-Matamoros A., Bonarini A., Escamilla-Hernandez E., Nakano-Miyatake M., Perez-Meana H. A facial expression recognition with automatic segmentation of face regions. Communications in Computer and Information Science. 2015; Vol. 532: 529-540.

15. Naz S., Ziauddin S., Shahid A.R. Driver fatigue detection using mean intensity, SVM, and SIFT. International Journal of Interactive Multimedia and Artificial Intelligence. 2019; Vol. 5, № 4: 86-93.

16. Priya R.V. Emotion recognition from geometric fuzzy membership functions. Multimedia Tools and Applications. 2019; Vol. 78, № 13: 17847-17878.

17. Wang X., Chen L. Contrast enhancement using feature-preserving bi-histogram equalization. Signal Image and Video Processing. 2018; Vol. 12, № 4: 685-692.

18. Mustapha A., Oulefki A., Bengherabi M., Boutellaa E., Algaet M.A. Towards nonuniform illumination face enhancement via adaptive contrast stretching. Multimedia Tools and Applications. 2017; Vol. 76, № 21: 21961-21999.

19. Oloyede M., Hancke G., Myburgh H., Onumanyi A. A new evaluation function for face image enhancement in unconstrained environments using metaheuristic algorithms. EURASIP Journal on Image and Video Processing. 2019; № 1: 27.

20. Рюмина Е.В., Карпов А.А. Аналитический обзор методов распознавания эмоций по выражениям лица человека. Научно-технический вестник информационных технологий, механики и оптики. 2020; Т. 20, № 2: 163-176.

References

1. Yu-Hua Yan, Tsair-Wei Chien, Yu-Tsen Yeh, Willy Chou, Shu-Chen Hsing. An App for Classifying Personal Mental Illness at Workplace Using Fit Statistics and Convolutional Neural Networks: Survey-Based Quantitative Study. JMIR Mhealth Uhealth. 2020; Vol. 8, № 7.

2. Soma G.M., Kadnova A.M. Raspoznavanie 'emocional'nogo sostoyaniya cheloveka na osnove svertochnoj nejronnoj seti. Nauchno-tehnicheskijvestnikinformacionnyh tehnologij, mehaniki i optiki. 2022; T. 22, № 1: 120-126.

3. Ryumina E.V., Karpov A.A. Analiticheskij obzor metodov raspoznavaniya 'emocij po vyrazheniyam lica cheloveka. Nauchno tehnicheskij vestnik informacionnyh tehnologij, mehaniki i optiki. 2020; T. 20, № 2: 163-176.

4. Liu W., Anguelov D., Erhan D., Szegedy C., Reed S., Fu C.-Y., Berg A.C. SSD: single shot multibox detector. Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 2016; Vol. 9905: 21-37.

5. Viola P., Jones M.J. Robust real-time face detection. International Journal of Computer Vision. 2004; Vol. 57, № 2: 137-154.

6. King D.E. Max-margin object detection. Available at: https://arxiv.org/pdf/1502.00046.pdf

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7. Deniz O., Bueno G., Salido J., De la Torre F. Face recognition using histograms of oriented gradients. Pattern Recognition Letters. 2011; Vol. 32, № 12: 1598-1603.

8. Aleksandrov A.A., Kirpichnikov A.P., Lyasheva S.A., Shlejmovich M.P. Analiz 'emocional'nogo sostoyaniya cheloveka na izobrazhenii. Vestnik tehnologicheskogo universiteta. 2019; T. 22, № 8: 120-123.

9. Voronov V., Strelnikov V., Voronova L., Trunov A., Vovik A. Faces 2D-recognition and identification using the HOG descriptors method. FRUCT: Proc. 24th Conference of Open Innovations Association. 2019: 783-789.

10. Mohan P.G., Prakash C., Gangashetty S.V. Bessel transform for image resizing. IWSSIP2011: Proc. 18th International Conference on Systems, Signals and Image Processing. Sarajevo, Bosnia-Herzegovina, 2011: 75-78.

11. Owusu E., Abdulai J.-D., Zhan Y. Face detection based on multilayer feed-forward neural network and Haar features. Software: Practice and Experience. 2019; Vol. 49, № 1: 120-129.

12. Su J., Gao L., Li W., Xia Y., Cao N., Wang R. Fast face tracking-bydetection algorithm for secure monitoring. Applied Sciences. 2019; Vol. 9, № 18: 3774.

13. Lowe D.G. Distinctive image features from scale-invariant keypoints. International Journal of Computer Vision. 2004; Vol. 60, № 2: 91-110.

14. Hernandez-Matamoros A., Bonarini A., Escamilla-Hernandez E., Nakano-Miyatake M., Perez-Meana H. A facial expression recognition with automatic segmentation of face regions. Communications in Computer and Information Science. 2015; Vol. 532: 529-540.

15. Naz S., Ziauddin S., Shahid A.R. Driver fatigue detection using mean intensity, SVM, and SIFT. International Journal of Interactive Multimedia and Artificial Intelligence. 2019; Vol. 5, № 4: 86-93.

16. Priya R.V. Emotion recognition from geometric fuzzy membership functions. Multimedia Tools and Applications. 2019; Vol. 78, № 13: 17847-17878.

17. Wang X., Chen L. Contrast enhancement using feature-preserving bi-histogram equalization. Signal Image and Video Processing. 2018; Vol. 12, № 4: 685-692.

18. Mustapha A., Oulefki A., Bengherabi M., Boutellaa E., Algaet M.A. Towards nonuniform illumination face enhancement via adaptive contrast stretching. Multimedia Tools and Applications. 2017; Vol. 76, № 21: 21961-21999.

19. Oloyede M., Hancke G., Myburgh H., Onumanyi A. A new evaluation function for face image enhancement in unconstrained environments using metaheuristic algorithms. EURASIP Journal on Image and Video Processing. 2019; № 1: 27.

20. Ryumina E.V., Karpov A.A. Analiticheskij obzor metodov raspoznavaniya 'emocij po vyrazheniyam lica cheloveka. Nauchno-tehnicheskj vestnik informacionnyh tehnologij, mehaniki i optiki. 2020; T. 20, № 2: 163-176.

Статья поступила в редакцию 19.02.23

УДК 882

Kumbasheva Yu.A., Cand. of Sciences (Philology), senior lecturer, Saint-Petersburg Polytechnic University n. a. Peter the Great (Saint-Petersburg, Russia),

E-mail: Kumbacheva@mail.ru

THE CONCEPT OF TIME IN L. ULITSKAYA'S NOVELS "DANIEL STEIN, TRANSLATOR" AND "THE GREEN TENT". The article deals with a problem of realizing the category of time in the prose of L. Ulitskaya on the example of novels "Daniel Stein, Translator" and "The Green Tent". In the first of them, the writer refers to the depiction of historical events (wars, conflicts) that determine the lives of the heroes and at the same time serve as a background for them. The fates of the heroes are traced - in a compressed or expanded form - throughout their lives, and the writer is primarily interested in what exactly influenced the formation of the character of a particular hero. The chaotic arrangement of chapters in the novel not only reflects postmodern traditions, but also expresses the author's concept of the equivalence of any life events - chapters on religious philosophy, love experiences or everyday trifles follow one another, they are equivalent in compositional and semantic terms, since in life these phenomena are inseparable. In the novel "The Green Tent", the writer is interested in the conditions for the formation of a person's character, the period of childhood, formation, and also the question of how much a person can influence the course of history. Ulitskaya comes to the conclusion that history is not subject to the will of man, that the connection between generations is lost, the characters forget their past - and the best way to convey this disunity of generations and times is the discontinuity, non-linearity of the narrative.

Key words: non-linear composition, time concept, postmodernism, chronotope, historical and artistic time

Ю.А. Кумбашева, канд. филол. наук, доц., Санкт-Петербургский политехнический университет Петра Великого, г. Санкт-Петербург,

E-mail: Kumbacheva@mail.ru

КОНЦЕПЦИЯ ВРЕМЕНИ В РОМАНАХ Л. УЛИЦКОЙ «ДАНИЭЛЬ ШТАЙН, ПЕРЕВОДЧИК» И «ЗЕЛЁНЫЙ ШАТЁР»

В статье рассматривается проблема реализации категории времени в прозе Л. Улицкой на примере романов «Даниэль Штайн, переводчик» и «Зелёный шатёр». В первом из них писательница обращается к изображению исторических событий (войн, конфликтов), которые определяют жизни геров и в то же время служат фоном и формируют их. Судьбы героев прослеживаются - в сжатом или развёрнутом виде - на протяжении всей жизни, причём писательницу в первую очередь интересует, что же именно повлияло на формирование характера того или иного героя. Хаотичность расположения глав в романе не просто отражает постмодернистские традиции, но и выражает авторскую концепцию равнозначности любых жизненных событий: главы о религиозной философии, любовных переживаниях или житейских мелочах следуют друг за другом, они равнозначны в композиционном и смысловом плане, так как и в жизни эти явления неразделимы. В романе «Зелёный шатёр» писательницу интересуют условия формирования характера человека, период детства, становление, а также вопрос о том, насколько личность может повлиять на ход истории. Улицкая приходит к выводу о том, что история не подвластна воле человека, что связь между поколениями утрачивается, герои забывают своё прошлое. Наилучшим средством передать эту разобщённость поколений и времён является прерывистость, нелинейность повествования.

Ключевые слова: нелинейная композиция, концепция времени, постмодернизм, хронотоп, историческое и художественное время

Современная русская литература, возникшая на стыке XX и XXI веков, имеет в значительной степени переходный характер. И творчество Л. Улицкой, которая является одной из центральных фигур современного литературного процесса, служит тому подтверждением.

Характерными чертами её крупных произведений является, с одной стороны, следование традициям классического семейного романа, с другой стороны, использование таких постмодернистских приёмов, как гротеск, интертекстуальность, нелинейность сюжета: писательница совершенно особым образом выстраивает композицию своих романов. В центре её сюжетов находятся судьбы людей, живущих в переломные моменты истории, а само историческое время - это не просто объект повествования, но и художественный инструмент, помогающий осмыслить прошлое, настоящее и будущее. Именно в этом и заключается актуальность исследования произведений Улицкой, в частности её романов.

Цель данного изыскания - рассмотреть, как в содержательном и композиционном планах в романах Улицкой проявляется категория времени (на примере романов «Даниэль Штайн, переводчик» и «Зелёный шатер»). Работа ставить перед собой следующие цели:

- определить, к какому из направлений современной российской прозы принадлежит её творчество;

- охарактеризовать концепцию времени в романах Улицкой: как концепт времени проявляет себя в романах «Даниэль Штайн, переводчик» и «Зелёный шатёр» с точки зрения исторического времени (взросления героев и развития их судеб на фоне исторических событий в стране и в мире) и художественного времени (как располагаются и соотносятся между собой части и главы романов, как они складываются в соответствии с замыслом автора в единую композиционную структуру);

- выявить наиболее общие закономерности реализации категории времени в прозе Улицкой.

Научная новизна работы заключается в том, что особенности реализации одной из категорий художественного текста (времени) рассматриваются как на уровне сюжета (историческое время как объект авторского внимания), так и на уровне композиционном (нарушение хронологии повествования как авторский приём). Результаты данного исследования помогают лучше понять современный литературный процесс и могут быть использованы в преподавании курса современной литературы - в этом заключается теоретическая и практическая значимость работы.

i Надоели баннеры? Вы всегда можете отключить рекламу.