Научная статья на тему 'К ВОПРОСУ О СОЗДАНИИ И РАЗВИТИИ ЭМОЦИОНАЛЬНОГО ИСКУССТВЕННОГО ИНТЕЛЛЕКТА'

К ВОПРОСУ О СОЗДАНИИ И РАЗВИТИИ ЭМОЦИОНАЛЬНОГО ИСКУССТВЕННОГО ИНТЕЛЛЕКТА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
346
66
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
искусственный интеллект / эмоциональный искусственный интеллект / эмоции / распознавание
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «К ВОПРОСУ О СОЗДАНИИ И РАЗВИТИИ ЭМОЦИОНАЛЬНОГО ИСКУССТВЕННОГО ИНТЕЛЛЕКТА»

Федосеева О.В.

к.э.н., доцент кафедры прикладных информационных технологий Института общественных наук РАНХиГС

К ВОПРОСУ О СОЗДАНИИ И РАЗВИТИИ ЭМОЦИОНАЛЬНОГО ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

Ключевые слова: искусственный интеллект, эмоциональный искусственный интеллект, эмоции, распознавание.

Искусственный интеллект - это свойство компьютеров или управляемых роботов выполнять действия, функции и задачи, свойственные человеческому интеллекту, их способность воспроизводить поведение человека. Это главный тренд, который уверенно лидирует среди прочих на рынке технологий в последние годы - неотъемлемой частью повседневной жизни становятся решения на основе искусственного интеллекта в самых разных аспектах: от оптимизации рабочих процессов до повышения комфортности быта. Сегодня с уверенностью можно сказать, что среднестатистический пользователь больше общается с виртуальными собеседниками в виде ботов, чем с живыми людьми.

Неудивительно, что в последнее время все большее внимание ученых привлекает такое направление исследований как эмоциональный искусственный интеллект (Emotion AI/Affective Computing), которым также интересуются крупные компании, инновационные проекты в ритейле, маркетинге, рекламе, образовании, консалтинге, управлении персоналом и других сферах. По данным Mordor Intelligence, рынок распознавания эмоций оценивался в $12 млрд. в 2018 году и вырастет до $92 млрд. к 2024 году1.

Affective Computing дословно переводится как эмоциональные вычисления, или эмоциональный искусственный интеллект. Это подвид искусственного интеллекта, который способен распознавать и интерпретировать человеческие эмоции, отслеживать выражения лица, язык тела, жесты или человеческую речь. Применение таких технологий уже стало реальностью, и количество случаев их использования растет с каждым днем. Уже сейчас Gartner прогнозирует, что к 2022 году 10% персональных устройств будут обладать возможностями искусственного интеллекта - это значительное увеличение по сравнению с менее чем 1% в 2018 году.

Согласно Harvard Business Review, рынок аффективных вычислений вырастет до 41 млрд. долларов к 2022 году, поскольку такие технологичные гиганты, как Amazon, Google, Facebook и Apple, будут бороться за лучшие разработки в области понимания и интерпретации эмоций своих пользователей2.

По словам Бронвина ван дер Мерве, директора Fjord Australia and New Zealand, инновационного подразделения Accenture, наиболее успешными системами искусственного интеллекта станут те, которые смогут развить эмоциональный интеллект, почти неотличимый от человеческого3. Пока искусственный интеллект не способен реализовы-вать те проявления, которые связаны с эмоциональным состоянием человека. Поэтому здесь неизбежно возникает вопрос - когда AI сможет достигнуть необходимого уровня развития эмоциональной составляющей, и наступит ли эпоха «компьютера с душой»?

Сегодняшняя база эмоционального искусственного интеллекта создает некую основу для ее дальнейшего развития. Существуют определенные технологии распознавания эмоций, о которых далее пойдет речь. Например, распознавание эмоций по мимике с помощью CV (компьютерное зрение), считывает их с помощью оптических датчиков, которые фиксируют выражение лица в режиме реального времени либо в записи с web-камер; анализирует же их специальная программа для распознавания. Кроме того, подобные программы используют возможности идентификации и проверки изображений, национальности, пола, возраста и других социально-демографических признаков.

Еще одной технологией является распознавание эмоций в устной речи с помощью обработки естественного языка. При этом анализируются именно фонационные, паралингвистические и экстралингвистические средства общения, раскрывающие эмоциональное состояние и особенности личности. Сегодня такой анализ проводят крупные компании и бренды в маркетинговых исследованиях, сфере здравоохранения и работе с голосовыми ассистентами. Здесь используются технологии машинного обучения, например, Python, сверточные нейронные сети в Keras/TensorFlow, другие алгоритмы глубокого обучения для распознавания эмоций в звучащей речи и измерения с высокой степенью точности эмоционального состояния человека. Существуют технологии многослойного анализа голоса Sence и Layered Voice Analysis (LVA), созданные израильской компанией Nemesysco (современный мировой лидер по разработке систем и изделий, основанных на голосовом анализе).

1 Эмоциональный ИИ - кто и зачем распознает эмоции в России и за рубежом // ЯЦЖАСЕ. -https://rb.ru/longread/emotion-ai

2 Эмоциональный ИИ - миф или будущее? - https://vc.ru/future/133199-emocionalnyy-ii-mif-ili-budushchee

33Эмоциональный интеллект - будущее ИИ. - https://yandex.ru/turbo/hightech.fm/s/2017/02/21/fjord-ai

При проведении такого анализа различными алгоритмами обрабатывается более 160 параметров. Анализируя разные слои в голосе и проводя глубокий анализ круга эмоций субъекта, технологии определяют степень волнения собеседника, его смущение, уровень напряженности, сосредоточенности и т.д. Анализ эмоций включает 4 основных процесса:

1. Анализ формы звуковой волны голоса для измерения особенностей высоких и низких частот голоса и их изменений по сравнению с образцом.

2. Точный частотный спектр вводимых данных по сравнению с образцом.

3. Расчет параметров, установленных на этапе предварительной подготовки и используемых для создания базового образца, свободного от эмоций.

4. Проверка и сравнение новых параметров с базовым состоянием субъекта и составление отчета.

С помощью вышеописанных технологий можно определить и измерить некоторые уровни эмоций (табл. 1):

Таблица 1

Уровни эмоций и их измерение

Уровень эмоций Характеристика измерения

Волнение (степень волнения/депрессии) Сравнение частот каждого фрагмента с базовым образцом, выделенным системой, для расчета уровня волнения в каждом звуковом фрагменте.

Смущение (насколько клиент уверен в том, что говорит) Измерение и сравнение мельчайших задержек в речи клиента с его обычной манерой говорить.

Напряжение, стресс Измерение в помехах на сверхнизких частотах.

Раздумье Время, затраченное клиентом на раздумья

Сосредоточенность Насколько клиент сосредоточен (излишняя сосредоточенность может квалифицироваться как обман)

Предупреждение Предупреждает ли клиент задаваемые ему вопросы (может квалифицироваться как попытка обмануть)

Несоответствие Насколько спокойно и уверенно себя чувствует клиент.

Раздражение Выявление раздражающих факторов клиента - что именно может его раздражать, что ему нравится, всегда ли его раздражает одно и то же.

Более глубокие эмоции Фиксация постоянных эмоций клиента (например, постоянное смущение или волнение)

Все это могут определить и измерить технологии Nemesysco, выявляя след, который оставляет мозг в эмоциональной окраске речи. Сфера применения технологий компании распространяется, они находят свое применение в государственном секторе, частном бизнесе, топ-менеджменте, в службах безопасности крупных компаний, в консалтинговых, кадровых и адвокатских агентствах, в финансовых организациях, антитеррористических структурах, в системах контроля допуска к особо важным объектам (аэропорты, массовые мероприятия), в службах управления персоналом и т.д. Существуют определенные системы реализации данных технологий: К-фактор (кадровая система тестирования претендентов на работу и работающего персонала); HRl-Кредит (система тестирования претендента на получение кредита); RA5 (для борьбы с мошенничеством в страховом и банковском бизнесе); QA5 (контроль за работой менеджеров) и др.1

Технологии распознавания эмоций потенциально широко применимы в сфере маркетинга и рекламы - например, при анализе рекламного воздействия на потребителей, которое осуществляется с помощью видеоконструкций, меняющих рекламные ролики в зависимости от настроения проходящих мимо посетителей. С помощью анализа видеопотока можно вычислить количество уникальных посетителей в той или иной торговой точке, определить индекс удовлетворенности каждого клиента и сопоставить эти данные с данными других магазинов, сетей продаж или филиалов. По словам Г. Плиева, основателя и управляющего партнера Neurodata Lab, это и будет своего рода Google Analytics в офлайн.

Говоря о применимости эмоционального AI в таких сферах, как b2b, стоит упомянуть облачное аналитическое решение (Human data analytics), благодаря которому пользователи могут после загрузки видеофайлов, получать эмоционально-поведенческую статистику фрагментарно по записи. Компания Affectiva, которая занимается разработками в области эмоционального AI, выпустила SDK, позволяющий отслеживать эмоции пользователя, отслеживая изменения в мимике пользователя, функционал которого разработчики могут добавить в свои приложения; другой ее разработкой стало участие в создании игры в жанре психологического триллера Nevermind. Напряженность зависит от состояния игрока: сюжет становится мрачнее, когда он испытывает стресс, и наоборот. Стартапы Affectiva и Cloverleaf разработали электронные ценники с рекламой, собирающие данные о покупательских эмоциях. Также новые технологии внедрили Procter&Gamble и Walmart, по словам представителей которых продажи поднялись в среднем на 30%, а вовлеченность покупателей возросла в 3-5 раз.

Среди российских стартапов весьма успешным проектом стал сервисный робот Promorobot, в котором используется нейросеть Neurodata Lab, определяющая человеческие эмоции по таким параметрам как частота пульса и дыха-

htm

1 Технологии анализа голоса Nemesysco // Системы безопасности Аквилона - http://www.akvilona.ru/news/sense-nemesysco.

ния, записи голоса и т.д. Сегодня 492 робота от Promorobot работают в 34 странах, таких как Саудовская Аравия, Кувейт, Швеция, Израиль в качестве гидов, консультантов, промоутеров, консьержей1.

Говоря о российском опыте внедрения эмоционального AI, нельзя не упомянуть пилотные проекты Сбербанка, Альфа-Банка, и Росбанка. Сбербанк - несомненный лидер и в этой области, тестирование эмоционального AI здесь началось еще в 2015 г., а сегодня создана Лаборатория нейронаук и поведения человека, которая проводит исследования в области нейрофизиологии, социальной психологии и когнитивистики, результаты которых впоследствии внедряются в повседневную практику. Основная цель Лаборатории - изучить и отследить соответствие продуктов экосистемы Сбербанка потребностям человека. В Альфа-Банке в 2018 г. был запущен пилотный проект анализа эмоций по видео. Росбанком совместно с Neurodata Lab было проведено тестирование определения эмоций по голосу и речи во время телефонных звонков клиентов - при звонке клиента в банк нейросеть анализировала его состояние, фиксируя паузы в речи, громкость голоса и время общения, что помимо определения эмоционального состояния, позволило контролировать степень клиентской удовлетворенности сервисом. Сейчас в Росбанке внедрено решение для распознавания эмоций, которое анализирует текст, а не акустические характеристики, которые исследовались изначально -сегодняшний алгоритм на основе текста автоматически определяет эмоцию. Безусловно, важен опыт использования эмоционального AI в медицине, например, для анализа ментального здоровья пациентов и наработки социальных навыков; в рекрутинговых компаниях и сфере HR при приеме кандидатов на ту или иную должность, в образовании -для исследования реакции слушателей во время занятий. Обращаясь к зарубежному медицинскому опыту нельзя не упомянуть израильскую компанию Beyond Verbal, которая совместно с клиникой Mayo Clinic исследует в голосе вокальные биомаркеры. По ним, кроме эмоций, определяется возможность прогнозирования аортокоронарных заболеваний, болезней Альцгеймера и Паркинсона.

Но также нельзя игнорировать сложность общих оценок работы с эмоциональным AI - не всегда возможно измерить эмоциональное состояние человека объективно, и не всегда та или иная реакция отражает истинную эмоцию, и что очень важно - требуется исследование целого спектра эмоций в других проявлениях, помимо выражения лица (например, движение).

По оценке Gartner, к 2024 году больше половины рекламных объявлений в Интернете будут сделаны с применением эмоционального искусственного интеллекта. Компьютерное зрение, которое используют для определения эмоций, станет одной из самых важных технологий в следующие 3-5 лет. Но здесь неизбежно возникает вопрос о цифровой этике - во-первых, не все готовы к тому, что машины будут считывать их эмоции; во-вторых, существуют определенные нюансы: например, сотрудники компании Affectiva, которые собирают и анализируют данные в 87 странах мира, выявили различия при одинаковых выражениях эмоций у представителей разных национальностей. К тому же, технологии, как оказалось, более предвзято относятся к определенным этическим меньшинствам. Все это повлияло на необходимость добавления еще одного слоя анализа в систему (сборка так называемых этических стандартов или кодифицированных предположений о том, как эмоция выражается в разных этнических культурах). В-третьих, неизбежны споры правового характера - слишком много данных попадает в социальные сети и Интернет, позволяя извлекать эмоциональные данные и использовать их для анализа.

1 Почему стоит беспокоиться о том, что машины читают ваши эмоции // КОЛБАСЕ. - https://rb.ru/story/artificial-emotional-intelligence-is/

i Надоели баннеры? Вы всегда можете отключить рекламу.