Научная статья на тему 'Программы-собеседники и их применение в бизнесе и образовании'

Программы-собеседники и их применение в бизнесе и образовании Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
195
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОГРАММЫ-СОБЕСЕДНИКИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Жиляев Владислав Олегович

В данной статьерассматриваются программы-собеседники (англ. Chatterbot или Chatbot), которые созданы для имитации речевого поведения человека.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Программы-собеседники и их применение в бизнесе и образовании»

Жиляев Владислав Олегович

ПРОГРАММЫ-СОБЕСЕДНИКИ И ИХ ПРИМЕНЕНИЕ В БИЗНЕСЕ И ОБРАЗОВАНИИ

1. ВВЕДЕНИЕ

Еще на заре компьютерной эпохи люди хотели научить машины общаться с оператором на естественном языке. Ранние системы, такие как БИЯВЬи [1], работая с ограниченным «миром кубиков» и используя ограниченный словарный запас, выглядели чрезвычайно хорошо, вдохновляя этим своих создателей. Однако оптимизм быстро иссяк, когда эти системы столкнулись со сложностью и неоднозначностью реального мира.

Данная задача породила науку - компьютерную лингвистику, включающую в себя такие разделы, как распознавание речи, синтез речи, анализ текста и т. д. В данной статье мы рассмотрим программы-собеседники (англ. СкаПетЬм или СкмЬм), которые созданы для имитации речевого поведения человека.

2. ЗАДАЧА СОЗДАНИЯ ПРОГРАММЫ-СОБЕСЕДНИКА

В 1950 г. Алан Тьюринг предложил [2] любопытный тест для проверки, является ли компьютер разумным: судья переписывается на естественном языке с двумя собеседниками, один из которых - человек, другой м компьютер. Если судья не может надежно определить, кто есть кто, считается, что компьютер прошел тест. Предполагается, что каждый из собеседников стремится, чтобы человеком признали его. Чтобы сделать тест

простым и универсальным, переписка сводится к обмену текстовыми сообщениями.

Пока что ни одна программа и близко не подошла к прохождению теста. Это объясняется тем, что такая задача считается А1-полной, то есть по сложности эквивалентной главной проблеме искусственного интеллекта - сделать компьютеры такими же умными, как люди.

Ежегодно производится соревнование между разговаривающими программами и наиболее человекоподобной, по мнению судей, присуждается приз Лёбнера. [3]

Самый лучший результат в данном соревновании показала программа А.Ь.1.С.Е., выиграв тест 3 раза (в 2000, 2001 и 2004). Но даже данная программа лишь имитирует осмысленный диалог, а по факту представляет собой огромную базу вопросов и ответов.

£смс Не Ня^ефНо ои^ефемибь,

кйо еойл кйо, счийлейс^, чйо кошпью&ер-прошел Лей.

И В ШУТКУ И ВСЕРЬЕЗ

87

3. УСТРОЙСТВО A.L.I.C.E.

Давайте заглянем внутрь ALICE. «Мозг» программы представляет собой набор файлов в формате AIML (подмножество XML, язык разметки для искусственного интеллекта), разбитых на 24.000 категорий [4].

Спираль (см. рис. 1) показывает устройство «мозга», где деревья, отходящие от корня - это шаблоны вопросов, на которые ALICE способна ответить. Самые большие пучки ответов ветвятся от слов WHAT, WHEN, WHERE, WHO и т. д.

В листинге 1 представлено, как выглядит часть «мозга» ALICE.

Рис. 1

Здесь тэг <pattern> обозначает вопрос, задаваемый пользователем. В нем можно использовать символы подстановки (*, _). Тэг <template> показывает ответ, который выдает машина.

Как мы видим, ALICE лишь имитирует диалог. Ни о какой разумной деятельности компьютера в данном случае говорить не приходится. Но даже такого уровня программы находят свое применение в практических задачах.

4. ПРОГРАММЫ-СОБЕСЕДНИКИ В БИЗНЕСЕ

В какой области могли найти свое первое применение программы, способные вести ограниченный диалог с человеком? Конечно же в поддержке сервисного обслуживания и помощи при выборе продукции.

Согласно исследованиям [5] в Америке в 2004 г. покупатели сделали порядка 1,5 миллиардов звонков в службы сервиса, причем средняя продолжительность звонка - 23 секунды. И поскольку клиенты используют все более и более сложные продукты, такие как цифровые видеокамеры, их вопросы также становятся все сложнее. При этом один звонок в среднем стоит компаниям 4-5 $. Именно поэтому корпорации

Листинг 1 <category>

<pattern>AFTER PRINCE CHARLES WHO IS * </pattern> <template>Prince William.</template> </category>

<category>

<pattern>ALAN TURING *</pattern> <template>

I really liked the biography of Turing by Andrew Hodges.

</template>

</category>

<category>

<pattern>CAN I PLAY * TURING GAME</pattern> <template>

We are already, playing, <get name="name"/> </template> </category>

Программы-собеседники и их применение в бизнесе и образовании

все чаще обращаются к помощи программ-собеседников, которые намного дешевле людей из службы поддержки - одно обращение стоит порядка 10 центов. Примерно 300 корпораций поставили себе на сайты подобные компьютерные агенты с 2001 по 2005 год.

Новым лицом известной компании Ikea стала программа Анна (рис. 2) [5], представленная красочно нарисованной улыбающейся женщиной. Она размещена на сайте и, используя сложную базу данных и лингвистические алгоритмы, отвечает на вопросы клиентов и помогает выбрать товар на 18 языках! Например, Анна способна показать карту на вопрос про ближайший магазин. Если она не может самостоятельно ответить на вопрос, она предлагает соединить с живым оператором. Похожий подход использовала компания AT&T [6] на своем сайте с персонажем Элли. Но он больше предназначен, чтобы сориентировать человека на сайте, показывая ему ссылки, соответствующие вопросам клиента.

Интересное применение нашла данная технология в американской армии. Корпорация «Next IT» разработала Сержанта Стара (рис. 3), который отвечает на вопросы будущих новобранцев. В основном это юноши в возрасте от 17 до 24 лет, которые большую часть времени проводят в интернете. Вот какие результаты [7] показало применение данной технологии:

- время пребывания на сайте возросло с 4 минут до 16 минут,

- количество заданных вопросов возросло с 6 до 13,

- при этом Сержант смог ответить на 92% вопросов,

- в месяц он отвечает примерно на 100.000 вопросов.

Результаты, конечно, впечатляют.

Еще одним примером может служить отечественная разработка компании «Нано-семантика» - кадровый агент Настя (рис. 4) [8]. Она разработана специально для кадрового агентства, поэтому основ-

Рис. 2

Рис. 3

Рис. 4

ной упор был сделан на умении Насти рассказывать об услугах агентства, отвечать на вопросы кандидатов и подбирать вакансии из базы данных текущих вакансий компании.

5. ПРОГРАММЫ-СОБЕСЕДНИКИ В ОБРАЗОВАНИИ

Про применение чат-ботов в образовании много говорится в последнее время. Но пока в данной области используются педагогические агенты (Pedagogical Agents), которые также представляются каким-либо персонажем, но при этом не обладают естественно-языковым способом ввода.

Программы-собеседники могут выступать в роли сообучающихся, конкурентов по обучению, помощников и инструкторов. Для эффективной педагогики агент должен отвечать на вопросы, давать подсказки и объяснения, отслеживать активность и прогресс обучающегося.

К работающим решениям можно отнести систему SmartHelp от компании Apangea [9]. Она в основном применяется для обучения учеников 5-11 классов математике, но в целом пакет может быть использован и в других областях. Согласно словам вице-президента компании, система ведет от 80 до 90 процентов обучения, и «живой» учитель вызывается только в тех случаях, когда сама программа справиться не может. В настоящий момент программа обучает порядка 300 учеников ежедневно.

Интересно также отметить систему Wizard-of-Oz [10], обучавшую студентов Бернимгемского университета электроники основам программирования на языке C в

И В ШУТКУ И ВСЕРЬЁЗ

89

СлуШ&Х, KOlfA сама

мофеМ.

малика tt мех

процессе обсуждений различных аспектов языка. В ходе этого эксперимента студенты выразили удовольствие от общения с программой-собеседником, легкость взаимодействия и желание продолжать обучение с помощью данной программы.

6. ПЕРСПЕКТИВЫ РАЗВИТИЯ

На данный момент проблема развития программ-собеседников, на мой взгляд, заключается в попытке имитировать диалог, решая задачу в огромном количестве частных случаев. Необходимо решение проблемы в корне, а именно создание высокоточного семантического анализатора, который мог бы сопоставить вводимому пользователем тексту смысл в форме, понятной компьютеру. Требуется применить более глубокие научные разработки как в области теоретических основ информатики, так и в области лингвистики.

В частности, применение подхода В.А. Тузова [11] к задаче создания программы-собеседника может качественно улучшить опыт пользователя от общения и релевантность ответов, которые программа выдает. Это разрешит многие проблемы современных программ-собеседников, такие как наличие различных словоформ, синонимов и даже фразеологизмов.

Литература

1. Procedures as a Representation for Data in a Computer Program for Understanding Natural Language. MIT AI Technical Report 235, Февраль 1971.

2. Alan Turing. Computing Machinery and Intelligence. Mind, vol. LIX, no. 236, October 1950, pp. 433-460.

3. Веб-сайт проекта: http://www.loebner.net/Prizef/loebner-prize.html

4. Веб-сайт проекта: http://www.alicebot.org/

5. Веб-сайт компании: www.ikea.com/ms/en US/customer service/splash.html

6. Веб-сайт компании «AT&T»: www.allie.att.com/nlq/virtual rep.jsp

7. Веб-сайт компании «Next IT»: http://www.nextit.com/Army Success.ashx

8. Веб-сайт компании «Наносемантика»: http://www.nanosemantics.ru/project-nastya/index.shtml

9. Публикация на сайте ChatbotHUB: «Internet Taking On New Role In Education».

10. Kerly, A., Hall, P. & Bull, S. (2006). Bringing Chatbots into Education: Towards Natural Language Negotiation of Open Learner Models, in R. Ellis, T. Allen & A. Tuson (eds), Applications and Innovations in Intelligent Systems XIV - Proceedings of AI-2006, 26th SGAI International Conference on Innovative Techniques and Applications of Artificial Intelligence, Springer.

11. Тузов B.A. Компьютерная семантика русского языка. СПб.: Изд-во С.-Петерб. ун-та, 2004.

Жиляев Владислав Олегович, аспирант 2 курса отделения информатики математико-механического факультета СПбГУ.

© Наши авторы, 2007 Our authors, 2007

i Надоели баннеры? Вы всегда можете отключить рекламу.