Научная статья на тему 'Опыт использования расширенной методики интент-анализа в процессе обучения специалистов информационного профиля'

Опыт использования расширенной методики интент-анализа в процессе обучения специалистов информационного профиля Текст научной статьи по специальности «Языкознание»

CC BY
590
280
Поделиться
Ключевые слова
МЕТОДЫ АНАЛИЗА / ИНТЕНТ-АНАЛИЗ / АНАЛИТИЧЕСКИЕ ТЕХНОЛОГИИ / СЛОВАРЬ ИНТЕНЦИЙ

Аннотация научной статьи по языкознанию, автор научной работы — Тимина Марина Владимировна

Рассмотрена история интент-анализа, содержание метода. Предложены для использования два варианта методики. Обосновывается значение расширенной методики в процессе обучения специалистов информационного профиля. Показаны результаты апробации методики, рассчитана доля ошибок и совпадений при выделении интенций в текстах документов. Приведен словарь интенций.

Текст научной работы на тему «Опыт использования расширенной методики интент-анализа в процессе обучения специалистов информационного профиля»

в них, отборе индикаторов слежения за рынком, адаптации программных продуктов к специфике предметного поля, интерпретации результатов машинной обработки. Для этого аналитику необходимо профессионально владеть современным инструментарием бизнес-аналитики.

М. В. Тимина

Опыт использования расширенной методики интент-анализа в процессе обучения специалистов информационного профиля

Рассмотрена история интент-анализа, содержание метода. Предложены для использования два варианта методики. Обосновывается значение расширенной методики в процессе обучения специалистов информационного профиля. Показаны результаты апробации методики, рассчитана доля ошибок и совпадений при выделении интенций в текстах документов. Приведен словарь интенций.

Ключевые слова: методы анализа, интент-анализ, аналитические технологии, словарь интенций.

Интент-анализ текста сам по себе является новым методом, находящимся на стыке различных наук: психологии, лингвистики, политологии, семантики. Конечно, для библиографической практики это тоже новый метод. Главной задачей, которую решает метод, является выявление и анализ авторских интенций (намерений) в тексте. Этот процесс, пусть проводимый не в полной мере, и не являющийся самоцелью, присутствует в работе библиографа, информационного работника.

Первое, с чем читатель имеет дело в любом тексте - это то, о чем говорится. Это может быть названо интенциональным содержанием авторского сознания (конкретное воплощение авторского мировидения). Авторские интенции и творческий акт писателя всегда эмоционально окрашены. В этом аспекте можно рассматривать любой текст как объективацию авторской эмоциональности.

Интенция (лат. т!епйо «намерение, замысел») - коммуникативное намерение говорящего. Термин «интенция» ввели в современную лингвистику последователи Дж Остина, одного из создателей теории речевых актов. Как известно, Остин предлагает делить речевые акты на три вида: локутивные, иллокутивные и перлокутивные. Задачей нового понятия было достижение более высокой точности в описании иллокуции и иллокутивной функции - второго уровня анализа высказывания1.

1 Теория речевых актов: Сб. ст. / Сост. и вступ. ст. И. М. Кобозевой и В. З. Демьянкова; общ. ред. Б. Ю. Городецкого. М.: Прогресс, 1986. 422 с. (Новое в зарубежной лингвистике; Вып. 17).

Суть метода интент-анализа заключается в выявлении и квалификации авторских интенций в тексте, дальнейшей их группировке по возможным объектам, оценке и характеристике выявленных интенций по различным шкалам и, наконец, построении выводного знания, в зависимости от цели анализа, в виде таблиц, графиков, диаграмм, ментальных карт (возможны и другие варианты).

Основоположниками интент-анализа в России следует назвать коллектив, сложившийся в Институте психологии Российской академии наук (ИПРАН): Т. Н. Ушакова, Н. Д. Павлова, В. В. Латынов, В. А. Цепцов, К. И. Алексеев. Их подход подробно рассмотрен в книге «Слово в действии: Интент-анализ политического дискурса» и оценивается авторами как психосемантический1.

При разработке расширенной методики интент-анализа для библиографов и информационных работников за основу была взята методика Т. Н. Ушаковой и Н. Д. Павловой. Особое внимание при разработке было уделено объяснению сути и методики квалификации интенций, в связи со сложностью этого процесса. Во-первых, проводилась необходимая минимальная теоретическая подготовка с целью объяснить особенности и задачи интент-анализа, его отличие от других методов. Во-вторых, в самом задании приводились примеры квалификации интенций и основные принципы их выделения. В-третьих, испытуемым предлагался примерный словарь интенций.

Опытная проверка методики интент-анализа проводилась в течение 2010-2011 года, и в это время сама методика, формулировка заданий незначительно изменялась для того, чтобы стать более понятной для испытуемых, чтобы натолкнуть их на определенные мысли. К примеру, был расширен список вопросов, на которые в ходе испытания должны были ответить студенты, было добавлено большее количество примеров для наглядности объяснения.

Самый сложный и спорный момент в общенаучной методике интент-анализа - это квалификация интенций. Для того, чтобы грамотно классифицировать интенции текста, необходимо, в первую очередь, иметь определенный опыт работы с текстами, а также некоторую долю профессиональной интуиции. Одной из особенностей методики является то, что для каждого отдельного массива информации (жанра текстов или определенной выборки) необходимы разные словари интенций. Это также является пробельной точкой методики, так как на данный момент в разных отраслях разработаны только несколько словарей интенций:

- словарь интенций для анализа предвыборных выступлений, разработанный Т. Н. Ушаковой, Н. Д. Павловой и другими2;

1 Слово в действии: Интент-анализ политического дискурса / Под ред. Т. Н. Ушаковой, Н. Д. Павловой; Рос. акад. наук, Ин-т психологии. СПб.: Алетейя, 2000. 314 с.

2 Там же.

- словарь И. Дзялошинского для анализа степени толерантности региональных и федеральных СМИ1 ;

- словарь Е. И. Кирилловой для анализа психотерапевтических сессий2.

Для интент-анализа характерна вариативность, и это объясняет то, что в

зависимости от цели анализа и характера документов для анализа применяются различные словари интенций. Из этого утверждения следует необходимость составления словаря интенций для справочно-библиографической работы. В ходе проведения эксперимента одной из первых задач значилось составление такого словаря.

Словарь интенций для информационных работников был составлен на основе всех работ испытуемых. В ходе эксперимента испытуемым предлагались только несколько вариантов возможных названий интенций с предложением самостоятельно означить присутствующие в тексте интенции. После, в ходе анализа работ, была составлена сводная таблица всех использованных испытуемыми интенций, затем она была сокращена. При помощи словарей синонимов интенции собирались в кластеры, затем выбиралось наиболее общее понятие для словаря. По итогам этой работы был составлен словарь интенций для информационных работников, в котором представлено 36 интенций. Они были распределены в 4 группы по признаку «характер эмоции», характеризующей намерение автора или читателя, потребителя информации (табл. 1).

Названные интенции обнаружены студентами в анализируемых текстах, одобрены экспертами. Интенции взаимосвязаны, достаточно динамичны, имеют жанровую специфику по признакам выражения. Группы могут детализироваться, пополняться, уточняться под тип ситуации и цели интент-анализа. Они наделяются лингвистическими признаками - ключевыми и служебными словами, междометиями, и даже паузами в устной беседе с читателем, или оценочным замалчиванием значимого компонента по теме в тексте документа, его названии.

Из их числа формируются группы интенций, тесно связанные с запросом. Например: оценивается отношение автора текста к событию. В этом случае может быть достаточным фиксация признаков сочувствия, оправдания или скрытого обвинения.

Опытная проверка расширенной методики интент-анализа велась в группах студентов 2-5 курсов Санкт-Петербургского государственного университета культуры и искусств. Временная норма на выполнение анализа одного

1 Социальное насилие и толерантность: реальность и медиа-образы: [Электронный ресурс] / И. Дзялошинский, Независимый институт коммуникативистики. Режим доступа: http://www.dzyalosh.ru.

2 Кириллова Е. И. Психологический анализ психотерапевтической речи: на материале текста диалога психотерапевтической сессии К. Роджерса с Джен: [Электронный ресурс]. Режим доступа: http://tinyurl.com.

текста объемом 3000-4500 знаков от 60 до 90 минут в зависимости от уровня подготовленности.

Оценка результатов опытной проверки методики велась в двух направлениях: выявление ошибок в сравнении с авторским опытным вариантом, подсчет процента совпадений.

Таблица 1

Таксономия интенций

Сильная позитивная эмоция в намерении автора или потребителя информации Сильная критическая эмоция в намерении автора или потребителя информации Сильная пессимистическая эмоция в намерении автора или потребителя информации Неопределенная, неуверенная (стохастическая) эмоция в намерении автора или потребителя информации

Оправдание Сарказм Замалчивание Добрая ирония

Восхищение Злорадство Отрицание Сочувствие

Одобрение Открытое обвинение Предопределенность Скрытое обвинение

Надежда Дискредитация (подрыв авторитета) Обреченность Тревога (неопределенность)

Оптимистический прогноз Негативная оценка (критика) Пессимистический прогноз Предупреждение (о последствиях)

Удивление (+) Разоблачение Подозрение

Презрение Разочарование

Побуждение к действию (рекомендация) Удивление (-) Побуждение к негативному действию (рекомендация) Недовольство

Вера Сомнение Скрытая критика

Равнодушие

Привлечение внимания (рассуждение)

Успокоение аудитории

Смирение

Слабая сторона интент-анализа в том, что он несет на себе отпечаток субъективизма, избавиться от которого представляется сложным до тех пор, пока в методике присутствует человеческий фактор. С другой стороны, важно понимать, что интент-анализ дает уникальные результаты, которые находятся в интуитивном согласии с пониманием текста человеком. Будучи изначально таким же читателем, как и другие, эксперт сна-

чала воспринимает текст, после чего «раскладывает» процесс его восприятия и анализирует, а затем фиксирует те эмоции, которые вызывает текст.

Субъективность методики интент-анализа также приводит к необходимости создания множества словарей интенций и большого количества вариаций представления выводного знания, а это усложняет процесс унификации методики.

В ходе анализа работ подсчитывалось количество интенций в каждой работе, общее количество выделенных интенций у испытуемых и у автора методики, количество всех трех видов ошибок, а затем подсчитывался процент ошибок (относительно общего количества интенций, выделенных испытуемыми, а также относительно интенций, выделенных автором методики).

Таблица2

Процент ошибок и совпадений в результатах испытуемых

Полное совпаден ие Формальны е Интерпретаци и Смысловы е Лишни е Всего

Кол-во 310 56 129 14 26 535 (11,89 )

% 57,94 10,47 24,11 2,62 4,86 100

% к эксперт. (836) 37,08 6,7 15,43 1,67 3,12 64

В результате профессиональной оценки методики были получены некоторые рекомендации, в частности, рекомендация создать дополнительную экспресс-методику интент-анализа в связи с нехваткой времени у практикующего библиографа для расширенной методики, выделить возможные сферы использования экспресс-методики в работе публичных библиотек.

Необходимо внести коррективы в методику, так как в ней присутствует избыточность для практики справочно-библиографической работы. Задание для эксперимента было запланировано на два академических часа (90 минут), но группа начинающих не всегда успевала выполнить работу в срок, около 30% студентов требовалось дополнительное время, по оценкам исполнителей еще около получаса. Экспериментальным путем выявлен примерный норматив на средний текст объемом 3000-4500 знаков - 60 минут для опытной группы, 90-120 минут для начинающих.

Разработанная экспресс-методика удобна для быстрого анализа текстов, она менее трудоемка, чем расширенный вариант интент-анализа, но охватывает те же уровни текста. Основные принципы методики экспресс-анализа: Условное разделение текста на логический и интенциональный планы.

Использование метода смысловой вилки для наглядного представления информации. Этот двухаспектный метод удобен, поскольку он упрощает методику до обозримого уровня, но в то же время отражает необходимые стороны текста для его освоения.

Определение абзаца как единицы анализа. Абзац обычно состоит из группы предложений, которые передают достаточно самостоятельный отрезок мысли и характеризуются определенными структурными закономерностями. Примем, что автор текста использует абзац для выделения ограниченного по смыслу и интенции отрезка текста.

Экспресс-методика носит пока наиболее общий характер и может развиваться в следующих направлениях:

- при определении ключевых предметных рубрик

- для анализа библиографических описаний

- для анализа полного текста.

При дальнейшем развитии экспресс-методики интент-анализа, возможно, будут меняться инструменты работы, сокращаться время, потраченное специалистами, будут составляться новые словари интенций, а также возможно развитие интент-анализа для анализа устной речи.

Интент-анализ, являясь одной из разновидностей содержательного анализа, может быть полезен во всех направлениях библиографической деятельности (библиографирование, обслуживание читателей), а также на всех этапах выполнения запросов читателей в процессе их справочно-библиографического обслуживания, а также в справочной работе библиотек на всех этапах обслуживания читателей. Это основные области применения данного метода в библиографической деятельности. Цель его использования - повысить качество отбора документов в увеличивающемся потоке информации. Не стоит также забывать о применении метода в работы с электронными документами. Сохраняя свою главную функцию повышения качества отбора информации, ин-тент-анализ может быть применен в составлении путеводителей по интернет-ресурсам.