Научная статья на тему 'Исследование оценочной ориентации наречий русского и английского языков'

Исследование оценочной ориентации наречий русского и английского языков Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
188
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДВУЯЗЫЧНЫЙ СЛОВАРЬ / АНТОНИМЫ / СИНОНИМЫ / ПРОСТРАНСТВО БИЛИНГВЫ / ДИФФЕРЕНЦИАЛ ОСГУДА / СЕМАНТИЧЕСКАЯ МЕТРИКА / ПЕРЕВОД / BILINGUAL DICTIONARY / ANTONYMS / SYNONYMS / BILINGUAL SPACE / OSGOOD DIFFERENTIAL / SEMANTIC METRICS / TRANSLATION

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Потемкин Сергей Борисович

Анализ настроений, выражаемых в речи, часто основывается на изучении семантической ориентации присутствующих в ней положительных и отрицательных слов. В статье предлагается подход к определению соответствий между русским и английскими оценочно ориентированными наречиями с опорой исключительно на данные специальных словарей. Такой подход предполагает построение цепочек квазисинонимичных слов, связывающих наречия. Характеризуются методы определения семантической метрики в пространстве Осгуда, возможности установления однозначной метрики на множестве русских (ось X) и английских (ось Y) наречий с использованием геодезического расстояния между словами. Координаты наречий-антонимов и цепочки синонимов, которые соединяют антонимичные пары, отображаются в англо-русском пространстве билингвы.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

English and Russian evaluative adverbs

The paper proposes an approach to determine correspondences between the relevant pairs of Russian and English evaluative adverbs. It has resulted in a list of Russian and the corresponding English pairs of adverbs. Chains of quasi-synonymous words linking the adverbs are constructed. An important feature of antonyms is the fact that negatively-oriented antonyms are marked with respect to the positive ones. The different methods for the determination of semantic metrics in the Osgood’s space are described. Usage of geodesic distance between two arbitrary words enables introduction of unambiguous metrics over the set of Russian (axes X) and English (axes Y) adverbs. Coordinates of antonyms and those synonyms which connect antonymous pairs are displayed in the two-dimensional English-Russian bilingual space.

Текст научной работы на тему «Исследование оценочной ориентации наречий русского и английского языков»

УДК 81 33

С. Б. Потемкин

ИССЛЕДОВАНИЕ ОЦЕНОЧНОЙ ОРИЕНТАЦИИ НАРЕЧИИ РУССКОГО И АНГЛИЙСКОГО ЯЗЫКА

Анализ настроений, выражаемых в речи, часто основывается на изучении семантической ориентации присутствующих в ней положительных и отрицательных слов. В статье предлагается подход к определению соответствий между русским и английскими оценочно ориентированными наречиями с опорой исключительно на данные специальных словарей. Такой подход предполагает построение цепочек квазисинонимичных слов, связывающих наречия. Характеризуются методы определения семантической метрики в пространстве Осгуда, возможности установления однозначной метрики на множестве русских (ось X) и английских (ось Y) наречий с использованием геодезического расстояния между словами. Координаты наречий-антонимов и цепочки синонимов, которые соединяют антонимичные пары, отображаются в англо-русском пространстве билингвы.

The paper proposes an approach to determine correspondences between the relevant pairs of Russian and English evaluative adverbs. It has resulted in a list of Russian and the corresponding English pairs of adverbs. Chains of quasi-synonymous words linking the adverbs are constructed. An important feature of antonyms is the fact that negatively-oriented antonyms are marked with respect to the positive ones. The different methods for the determination of semantic metrics in the Osgood's space are described. Usage of geodesic distance between two arbitrary words enables introduction of unambiguous metrics over the set of Russian (axes X) and English (axes Y) adverbs. Coordinates of antonyms and those synonyms which connect antonymous pairs are displayed in the two-dimensional English-Russian bilingual space.

Ключевые слова: двуязычный словарь, антонимы, синонимы, пространство билингвы, дифференциал Осгуда, семантическая метрика, перевод.

Keywords: bilingual dictionary, antonyms, synonyms, bilingual space, Osgood differential, semantic metrics, translation.

17

Введение

Мнение общественности и потребителей обладает огромной ценностью для маркетинга, РИ-бизнеса и политических кампаний. В условиях стремительного развития социальных сетей (а также форумов, блогов, микроблогов и др.) пользователи Интернета все чаще ориентируются на этот контент для принятия решений. Например, потенциальному покупателю товара или услуги доступно множество отзывов пользователей на публичных форумах. В деятельности организаций контент социальных медиа может заменять даже данные социологических опросов. Однако поиск, изучение и обработка отзывов, публикуемых в Интернете, — сложная задача. Каждый сайт содержит большой

© Потемкин С. Б., 2019

Вестник Балтийского федерального университета им. И. Канта. Сер.: Филология, педагогика, психология. 2019. № 3. С. 17—28.

18

объем мнений, который не так-то просто эффективно охватить и обобщить. Для решения этой задачи необходимы специальные научные методики.

Технологии анализа эмоций сегодня востребованы в самых различных областях: от оценки потребительских товаров или услуг здравоохранения до проведения социальных событий и политических выборов. Большое значение при изучении оценочной ориентации текста и его фрагментов (параграфов, предложений, фраз) имеет анализ входящих в текст оценочно-ориентированных наречий. Наречия в тексте усиливают, модифицируют или инвертируют значения связанных с ними слов, в частности глаголов. В нашем предыдущем исследовании [11] проведено измерение семантической близости между словами из базового набора наречий и представлено графическое отображение такого набора. Также был предложен новый подход к семантической классификации прилагательных [17].

Сегодня доступность ресурсов для обработки естественного языка (Natural Language Processing) остается актуальной проблемой, особенно для русского языка — вследствие отсутствия исчерпывающих семантических ресурсов, несмотря на усилия, направленные на развитие русской версии WordNet (RusWordNet) [1]. Возможность определения связности, сходства или семантического расстояния между лексемами и выражаемыми ими понятиями лежит в основе вычислительной лингвистики. В этой статье рассмотрено измерение семантического расстояния в синтаксической категории наречий. Наречия модифицируют или уточняют смысл других слов, входящих в предложение (глаголов, существительных, прилагательных), в силу чего представляют особый интерес при определении оценочной ориентации синтагм, содержащих наречие-модификатор. Определение семантического расстояния между словами английского языка чаще всего основывается на использовании базы данных WordNet [16] и почти исключительно на таксономических отношениях, установленных в ней. В рамках такого подхода возможно определение семантического расстояния только между словами, относящимися к синтаксическим категориям существительных или глаголов, но не наречий.

Цель данной работы — извлечь список оценочных наречий и разработать метод определения меры их семантической близости с использованием словарей синонимов.

Составление базового набора наречий

Был предложен ряд подходов к созданию словарей оценочной ориентации для английского языка, большинство которых являются дорогостоящими в силу вычислительной сложности и предполагают существенную ручную обработку данных и крупные текстовые корпуса. В частности, при оценке качества новых словарей как эталон используется Генеральный Вопросник (ГВ) [18], созданный в начале прошлого века. Русская лексикография не имеет открытого и надежного лексикона с позитивно и негативно помеченными словарными статьями. Мы предлагаем некоторые подходы к созданию лексикона оценочной ориентации множества русских наречий, который включал бы как отдель-

ные слова, так и наречные фразеологизмы. В выдвигаемом подходе используются словари антонимов и синонимов. Создание такого лексикона требует небольшого объема ручной фильтрации при обработке баз данных.

Прежде всего мы проанализировали опубликованные словари антонимов. В работе [10] приведена таблица подсчета общего числа антонимов, оригинальных антонимических пар и процент последних.

Таблица 1

Количество антонимических пар в словарях антонимов [10]

Редактор словаря Всего пар Оригинальные пары Оригинальные пары, %

А. С. Гаврилова [5] 585 29 4,96

О. Д. Ушакова [12] 886 117 13,21

Л. А. Введенская [4] 943 101 10,71

Н. П. Колесников [6] 1334 345 25,86

М. Р. Львов [8] 2838 551 19,42

О. А. Михайлова [9] 4056 1567 38,63

Л. Г. Бабенко [3] 15397 12823 83,28

Краудсорсинг (Викисловарь) [7] 17870 14272 79,87

19

К сожалению, весь список антонимов в настоящее время не представлен в свободном доступе.

В качестве основного источника антонимов русского языка нами принят «Словарь антонимов русского языка» М. Р. Львова [8], содержащий более 2000 антонимических пар. Пополнение списка из других словарей [19] дало примерно 7600 пар антонимов (прилагательные, существительные, глаголы, наречия и предлоги), то есть их число близко к числу антонимических пар Word.Net. Оценочные слова были вручную извлечены из этого списка и расположены в двух отдельных подсписках — положительно-ориентированных (1859) и отрицательно-ориентированных (2229) слов. Эти базовые списки можно сравнить с английским лексиконом ГВ, который содержит маркеры оценочной ориентации, всего около 3600 пар.

Основным источником списков синонимов и антонимов английского языка, распределенных в алфавитном и идеографическом порядке, в течение многих десятилетий служил знаменитый тезаурус Роже. В настоящее время опыт тезауруса Роже обобщен в виде лексической базы данных WordNet, который является общепризнанным источником лексикографической информации. Простота структуры позволяет сравнительно легко встраивать эту базу знаний в прикладные системы. Основным структурным элементом WordNet является синсет — синонимический ряд. Одно слово может принадлежать различным синсе-там и выражать различные понятия. Между синсетами установлен ряд ассоциативных отношений типа: гипоним, гипероним, голоним, меро-ним. Для некоторых лексических единиц, входящих в WordNet, указаны также антонимы. Число антонимических пар в WordNet превышает

10000. Для иных языков имеющиеся ресурсы подобного рода значительно меньше по объему — от 20 до 70 % от английского ресурса. Известно, что RusWordNet [1] менее развит, чем английский, в отношении покрытия лексики и представленных семантических отношений.

Двуязычный словарь, используемый как источник переводных эквивалентов, представляет собой лексическую базу данных — ЛБД [11], которая в своей основе имеет англо-русские и русско-английские словари, доступные в электронном виде и частично введенные в компьютер с бумажных носителей. Всего использовано более 30 словарей, из которых отобрано и внесено в реляционную БД около 1,5 млн записей. Каждая запись включает следующие поля:

— английское слово (словосочетание);

— POS английского слова;

— русское слово (словосочетание);

— грамматика русского слова (по А. А. Зализняку);

— лексические и стилевые пометы;

— список словарей, зафиксировавших данную англо-русскую пару эквивалентов.

Представление ЛБД в виде реляционной таблицы позволяет легко проводить всевозможные сортировки, поиск, вводить новые поля для записи производных данных и составлять программы обработки, пользуясь языками программирования БД.

Таблица 2

Фрагмент списка антонимов английского и русского языков

Ea Eb Ra Rb

acclaim boo аплодировать освистывать

acclaim hiss аплодировать свистеть

acclivity descent подъем падение

acclivity descent подъем спуск

acquaintance stranger знакомый неизвестный

acquiesce dissent соглашаться возражать

action inactivity действие бездействие

action inactivity деятельность бездействие

Следующий шаг состоял в том, чтобы расширить базовый лексикон для достижения плотного покрытия различных текстов, рассматриваемых при анализе настроений. В качестве лексического источника мы используем структурированный список русских синонимов, собранных из ряда опубликованных и доступных в Интернете словарей (11 источников), в частности широко известный словарь З. Е. Александровой [2]. Список синонимов содержит около 600 тыс. пар слов, включая около 10000 пар наречий. В первом приближении все синонимы ^(т)} каждого слова wi базового набора получают ту же оценочную ориентацию, что и wi. Число вхождений синонимов s(wi) в расширенном множестве,

порожденном разными словами базового набора т, (1 = 1... п), указывает на достоверность оценочной ориентации. После ручной фильтрации нами получен список положительно (5990 лексем, включая 731 наречие) и негативно маркированных (6853 лексем, включая 592 наречия) слов. Следует отметить, что при составлении списка пар антонимов мы старались выделить главное значение лексемы: например, выбиралось значение «страшно» как эмоциональное состояние, а не как синоним слова «сильно». Так как большая часть русских наречий совпадает с краткой формой единственного числа среднего рода или краткой формой прилагательного множественного числа (3135), список оценочных наречий может быть расширен.

Меры расстояния

21

Существует ряд мер семантического расстояния для слов английского языка, основанных (полностью или частично) на WordNet. В частности, такая мера определяется как число ребер пути через таксономические отношения (отношение 1Б-А, Раг1:-о£ или гиперонимия). В [11] понятие длины связи было расширено для всех отношений в WordNet посредством их кластеризации в горизонтальном (синонимы) или вертикальном (гипонимы-гиперонимы) направлении и назначении штрафа за изменение направления движения по пути. Обзор пяти мер и оценка их эффективности с использованием ассоциаций между словами приведены в [15]. Однако такие меры не могут быть применены к прилагательным и наречиям.

Семантическое расстояние между словами можно было бы определить по аналогии с тем, как устанавливаются расстояния в теории графов. Самый простой подход — собрать все слова из словаря синонимов и связать каждый член синонимической группы с ее доминантой, указанной в словаре. Пусть С(№,Б) — неориентированный граф; № — множество узлов, являющихся словами из словаря с отмеченной частью речи; Б — набор ребер, соединяющих каждый член группы синонимов с ее доминантой. Слова в каждой синонимической группе будут связаны друг с другом через доминанту и сформируют клику в графе С. Путь Р представляет собой последовательность узлов, связанных ребрами С, а геодезическая — кратчайший путь между двумя узлами. Геодезическое расстояние 0(т, ") между словами " и " является длиной (числом ребер) кратчайшего пути между " и Если между " и " нет пути, расстояние между ними не определено. Геодезические задают метрику на множестве синонимов, для которой выполняются все аксиомы метрического пространства. Обычно синонимичные группы содержат слова одной и той же грамматической категории, а весь граф С разбивается на непересекающиеся подграфы для существительных, глаголов, прилагательных и наречий (рис. 1). В каждом графе существует максимальная связная компонента, содержащая 70 — 90 % всех узлов графа. Максимальная компонента в классе русских наречий содержит около 8500 лексем.

к< к<

Рис. 1. Фрагмент максимальной связной компоненты подграфа наречий,

Оценочная ориентация наречий

Большинство западных исследований оценочной ориентации слов базируется на использовании ресурса SentiWordNet 3.0 [14], фрагмента WordNet 3.0, синсеты которого вручную аннотированы как ориентированные положительно, отрицательно или нейтрально. Этот ресурс содержит примерно 117 тысяч слов. Прямой перевод SentiWordNet на русский язык вызывает серьезные затруднения, как это показала работа над RusWordNet [1].

Фундаментальное значение для измерения оценочных или аффективных значений слов в текстах имеет теория семантического дифференциала (СД) Чарльза Осгуда. Значение слова в когнитивной психологии является строго психологическим: это когнитивные состояния пользователей человеческого языка, которые являются необходимыми предусловиями для избирательного кодирования лексических знаков и необходимых постусловий в избирательной расшифровке знаков в сообщениях. Ч. Осгуд [18], который впервые предложил метод семантического дифференциала, пытался получить от испытуемых оценку слов-понятий из самых разных понятийных классов, в частности прилагательных (например: близкий, простой, приблизительный и т. д.). Испытуемым предлагалось оценить эти слова с точки зрения того, насколько они «добрые» или «злые», «сильные» или «слабые», «большие» или «маленькие» и т. п.

Математическая обработка результатов эксперимента показала, что по некоторым шкалам оценки в значительной степени совпадали между собой. При этом выяснилось, что совпадающие шкалы могут быть объединены в три группы — так называемые факторы, которым Ч. Осгуд приписал следующие названия: оценка, сила и активность. Каждая пара противоположно ориентированных прилагательных является осью в методе СД. Применение факторного анализа к обширному эмпирическому материалу дало неожиданный результат — большую часть вариаций суждений можно объяснить только тремя основными факторами: положительный / отрицательный, сильный / слабый и активный / пассивный. Среди этих факторов первый имеет наибольший относительный вес для определения оценочной ориентации.

Семантический дифференциал может быть естественным образом распространен на качественные наречия, которые обладают семантическим значением и, соответственно, доставляют информацию об оценочной ориентации. Все три пары биполярных наречий отрицательно / положительно; слабо / сильно, пассивно / активно содержатся в максимальной связной компоненте субграфа синонимичных наречий Gadv. Можно предположить, что расстояние от произвольного наречия до положительно является мерой положительной оценки наречия. Однако нетрудно показать, что эта мера на самом деле довольно противоречива.

Яркой иллюстрацией является то, что слова положительно и отрицательно довольно близко связаны через цепочку синонимов. В английском языке антонимы связывает цепочка из 5 слов (negatively, hardly, tightly, thoroughly, comprehensively, soundly, positively), а в русском — из

23

6 слов (плохо, дешево, легко, просто, совсем, очень, здорово, хорошо) (рис. 1). Каждая пара слов в этой последовательности является синонимами (по крайней мере, в одном из значений). Конечно, это не связано с какой-либо ошибкой в словаре синонимов. Частичное объяснение заключается в широком использовании русских наречий хорошо (625 ipm) и плохо (187 ipm) [13]. Мы можем рассматривать не только кратчайшее расстояние от любого наречия до хорошо, но и кратчайшее расстояние до его антонима плохо. Эта идея конкретизирована [17] в определении функции EVA, которая позволяет измерять относительное расстояние от некоторого слова до двух антонимов:

EVA (w) = ((d(w, neg) - d(w, pos)) / d(neg, pos).

В предположении, что нет слова «хуже, чем плохо» или «лучше, чем хорошо», значения EVA лежат в интервале [-1, 1]. Например, оценка слова «честно» равна

EVA (честно) = й(честно, neg) - й(честно, pos)\ /d(pos, neg) = (8 - 2) / 6 = 1.

Аналогичным образом определяются меры для других размерностей СД. Для фактора сильно/ слабо определена функция

POT (w) = (d(w, weakly) — d(w, strongly)) / d (weakly, strongly).

Для фактора активности определена функция

ACT (w) = (d(w,passively) - d(w, actively)) / d (actively, passively).

Таким же образом можно определять относительное расстояние для любых двух слов, принадлежащих к максимальной связной компоненте подграфа наречий. Предположение о граничном положении слов хорошо / плохо не вполне оправданно. Очевидно, существуют наречия, выражающие высшую степень некоторого свойства. Для слова хорошо (в главном значении) таким наречием будет превосходно, с использованием лексической функции Magn() можно записать: превосходно = Magn(хоро-шо). То же самое справедливо для английских слов: excellent = = Magn(good). Интуитивно координаты превосходно и excellent должны выходить за пределы интервала [-1, 1] в осях плохо-хорошо, bad-good. Для учета этого явления мы заменяем функцию EVA функцией EVA1 (w):

EVA1 (w) = (d (w, neg) - d (w, pos)) * (d (w, neg) + d (w, pos))/d2 (neg, pos).

Значения EVA1 иногда выходят за интервал [-1, 1]. Аналогично мы можем перепроектировать POT1(w) и ACT1(w). Для английских прилагательных (и качественных наречий) существует источник для оценки построенной выше меры по сравнению с независимо полученными ответами на ГВ [18], который содержит набор слов для оценки трех факторов Осгуда. Сравнение результатов из ответов на ГВ дало значения 70 — 80 % совпадений с нашими результатами в зависимости от того, какие слова считались нейтральными относительно функций EVA1, POT1, ACT1.

Мы полагаем, что антонимичные наречия лежат на противоположных концах, или диаметрах, множества наречий. Методы многомерного шкалирования обеспечивают отображение многомерного пространства с заданными расстояниями между отдельными точками d(wi, wj) на пространство меньшей размерности, а именно плоскость (рис. 2).

Рис. 2. Подмножество наречий, отображенное на плоскость.

Каждое наречие отображается точкой (знак +)

На рисунке 2 видно, что пары антонимов лежат вблизи диаметров множества наречий. Для более подробного изучения структуры пространства наречий мы построили цепочки синонимов, соединяющих пары антонимов в подграфе Gadv. Путь на рисунке 3, а является цепочкой синонимов, которая проходит по периферии множества наречий, а расстояния между синонимами не превышают расстояния между антонимами. К сожалению, ситуация не всегда благоприятна. На рисунке 3, б пара антонимов близка к диаметру, но цепочка синонимов не находится на периферии множества, а лежит в его центральной части и изменяет свое направление. При этом расстояние между синонимами часто больше, чем расстояние между антонимами. Вероятно, необходимо точнее определить семантическое расстояние между словами и правильно выбрать оси пространства наречий, используя метод главных компонентов. Эти новые оси необязательно будут совпадать с размерностями Осгуда.

Рис. 3. Две цепочки синонимов, соединяющие антонимические пары наречий: a — цепочка, согласованная с расстоянием EVA; б — цепочка, не согласованная с расстоянием EVA

На рисунке 4 приводится двумерный график, по оси Х которого размещены русские наречия, а по оси Y — английские наречия, ранжированные по возрастанию согласно мере расстояния функции EVA от «плохо» до «хорошо» и от «negatively» до «positively» соответственно. На отрезке от (-1, -1) до (1, 1) лежат точки, координаты которых соответствуют парам (русское наречие, английское наречие). Исходя из графика на рисунке 4 можно подобрать подходящие по оценочной ориентации пары англо-русских и русско-английских эквивалентов.

Рис. 4. Пространство билингвы для русских и английских антонимов

Подведем итог. Мера расстояния между наречиями может быть определена с использованием графа синонимов. Выбор меры расстояния на основе цепочки синонимов намечает подход к проблеме определения оценочной ориентации наречий. В отличие от семантического дифференциала Осгуда, связанного с реакцией людей на представленные им стимулы или возможным эмоциональным воздействием слов, наша модель основана исключительно на лексическом материале и предназначена для представления объективных значений, которые зафиксированы в словарях. Определенные нами функции расстояния до семантически противоположных лексем, ЕУА1, РОТ1 и АСТ1, позволяют вычислять расстояния до лексем Magn (хорошо), Magn (плохо) и пр. и находить супремум и инфинум на осях Осгуда. Дальнейшие исследования будут направлены на определение оценочной ориентации предложения или всего текста на основе ориентации составляющих его слов. Наш метод позволяет оценивать не только наречия, но и другие классы слов — таких, как существительные, прилагательные и глаголы, —

но для этого потребуется значительное увеличение объема вычислений и развитие специальных методов обработки больших данных, поскольку для вычисления кратчайших путей требуются число операций O (п3), где п — число слов в графе G(W, S).

Список литературы

1. Азарова И. В., Митрофанова О. А., Синопальникова А. А. Компьютерный тезаурус русского языка типа WordNet. URL: http://project.phil.spbu.ru/RussNet/ index.ru.shtml (дата обращения: 11.02.2018).

2. Александрова З. Е. Словарь синонимов русского языка : практ. справочник. М., 2005.

3. Бабенко Л. Г. Большой толковый словарь синонимов русской речи: идеографическое описание, антонимы, фразеологизмы. М., 2008.

4. Введенская Л. А. Словарь антонимов русского языка. М., 2004.

5. Гаврилова А. С. Словарь синонимов и антонимов современного русского языка. М., 2014.

6. Колесников Н. П. Словарь антонимов русского языка. Тбилиси, 1972.

7. Русский Викисловарь : [сайт]. URL: https://ru.wiktionary.org (дата обращения: 11.02.2018).

8. Львов М. Р. Словарь антонимов русского языка. М, 2006.

9. Михайлова О. А. Словарь синонимов и антонимов для школьников. М., 2009.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10. Мухин Ю. М. Границы русской антонимии. Лексическая практика // Известия Уральского федерального университета. Сер. 2: Гуманитарные науки. 2017. Т. 19, № 3 (166). С. 203 — 214.

11. Потемкин С. Б. Семантическое расстояние на лингвистической базе данных и WordNet // Матер. X Междунар. конф. «Когнитивное моделирование в лингвистике», CML-2008, Черногория. Бечичи, 2008. С. 88.

12. Ушакова О. Д. Синонимы и антонимы. Словарик школьника. СПб., 2016.

13. Шаров С. А., Ляшевская О. Н. Частотный словарь современного русского языка (на материалах Национального корпуса русского языка). М., 2009. URL: http://www.artint.ru/projects/frqlist.asp (дата обращения: 11.02.2018).

14. Baccianella S., Esuli A., Sebastiani F. SentiWordNet 3.0: An Enhanced Lexical Resource for Sentiment Analysis and Opinion Mining // Proceedings of the 7th Conference on International Language Resources and Evaluation, LREC, 2010. URL: http://www.lrecconf.org/proceedings/lrec2010/pdf/769_Paper.pdf (дата обращения 25.02.2019).

15. Budanitsky A., Hirst G. Semantic Distance in WordNet / / Workshop on WordNet and Other Lexical Resources. NAACL, 2001. URL: http://ftp.cs.toronto. edu/pub/gh/Budanitsky+Hirst-2001.pdf (дата обращения: 11.02.2018).

16. WordNet: An Electronic Lexical Database / ed. by C. Fellbaum. Cambridge, 1998. URL: http://wordnet.princeton.edu/ (дата обращения: 11.02.2018).

17. Kamps J., Marx M., Robert J., Mokken M. Using WordNet to Measure Semantic Orientations of Adjectives / / Proceedings of the 4th International Conference on Language Resources and Evaluation, LREC. 2004. P. 1115 — 1118.

18. Osgood C.E., Succi G.J., Tannenbaum P. H. The Measurement of Meaning. Urbana, 1957.

19. Potemkin S. B., Kedrova G. E. Exploring Semantic Orientation of Adverbs // CDUD'11 — Concept Discovery in Unstructured Data. URL: https://www.academia. edu/3031219/CDUD_11_Concept_Discovery_in_Unstructured_Data (дата обращения: 11.02.2018).

27

28

Об авторе

Сергей Борисович Потемкин — канд. техн. наук, науч. сотр., Московский государственный университет им. М. В. Ломоносова, Россия. E-mail: prolexprim@gmail.com

The author

Dr Sergey B. Potemkin, Research Fellow, Lomonosov Moscow State University, Russia.

E-mail: prolexprim@gmail.com

i Надоели баннеры? Вы всегда можете отключить рекламу.