Научная статья на тему '2018. 01. 017. Бенамара Ф. , Табоада М. , Мэтью Я. Язык оценки за рамками "мешка слов": лингвистические наблюдения и компьютерное применение. Benamara F. , Taboada M. , Mathieu Y. evaluative language beyond bags of words: linguistic insights and computational applications // computational linguistics. - 2017. - vol. 43, iss. 1. - Р. 201-264'

2018. 01. 017. Бенамара Ф. , Табоада М. , Мэтью Я. Язык оценки за рамками "мешка слов": лингвистические наблюдения и компьютерное применение. Benamara F. , Taboada M. , Mathieu Y. evaluative language beyond bags of words: linguistic insights and computational applications // computational linguistics. - 2017. - vol. 43, iss. 1. - Р. 201-264 Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
106
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОЦЕНКА / СКРЫТАЯ ОЦЕНКА / АВТОМАТИЧЕСКАЯ КЛАССИФИКАЦИЯ ТЕКСТОВ ПО ТОНАЛЬНОСТИ / КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА / МАШИННОЕ ОБУЧЕНИЕ / "МЕШОК СЛОВ"
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «2018. 01. 017. Бенамара Ф. , Табоада М. , Мэтью Я. Язык оценки за рамками "мешка слов": лингвистические наблюдения и компьютерное применение. Benamara F. , Taboada M. , Mathieu Y. evaluative language beyond bags of words: linguistic insights and computational applications // computational linguistics. - 2017. - vol. 43, iss. 1. - Р. 201-264»

французского языков, в том числе вторая редакция «Часослова» и «Дуинские элегии» Рильке. Особенность данного издания заключается в том, что в нем представлены параллельные тексты оригинала и перевода. В 2003 г. был опубликован сборник «Искры». В сборник вошли переводы из Байрона, Гейне, Рильке, Верлена, а также менее известных русскому читателю поэтов, таких как Нэнси Кэмп-белл, Хильда Конклинг, Руперт Брук.

Проведенный анализ переводов позволили автору главы прийти к следующим выводам.

1. Переводы характеризуются «высокой степенью эквивалентности. Эквивалентность приближается к максимальной степени на уровне метроритмической структуры» (с. 253).

2. «Переводчица ведет очень тщательную работу с лексикой. В большинстве случаев М.В. Пиккель находит точные соответствия в языке перевода, возможны синонимические замены, в том числе контекстуальные синонимы. Частотными являются грамматические трансформации - замены формы слова, частей речи. В результате образная ткань оригинала гармонично перетекает из оригинала в перевод, сохраняя основной тон образа. В переводах встречаются многочисленные добавления и опущения, которые, однако, не оказывают существенного влияния на общую эстетическую реакцию воспринимающего. Более сложные трансформации образа происходят в результате использования приема смыслового развития» (с. 253-254).

3. «На уровне синтаксических структур также можно наблюдать сознательную работу переводчицы. Синтаксический параллелизм, многочисленные повторы, различные виды синтаксических связей - все это М.В. Пиккель пытается воспроизвести в переводах» (с. 254).

В конце монографии приводятся сведения об авторах.

М.Б. Раренко

2018.01.017. БЕНАМАРА Ф., ТАБОАДА М., МЭТЬЮ Я. ЯЗЫК ОЦЕНКИ ЗА РАМКАМИ «МЕШКА СЛОВ»: Лингвистические наблюдения и компьютерное применение.

Benamara F., Taboada M., Mathieu Y. Evaluative language beyond bags of words: Linguistic insights and computational applications // Computational linguistics. - 2017. - Vol. 43, Iss. 1. - Р. 201-264.

Ключевые слова: оценка; скрытая оценка; автоматическая классификация текстов по тональности; компьютерная лингвистика; машинное обучение; «мешок слов».

Статья посвящена исследованию взаимодействия языкознания и компьютерной лингвистики в целях повышения точности определения тональности текстов и состоит из шести разделов. Первые два представляют собой подробное введение в проблему изучения языка оценки с позиций языкознания и компьютерной лингвистики. В третьем разделе критикуется классическое определение языка оценки и обосновывается актуальность его динамической модели, включающей функции обновления. Функции обновления позволяют учесть различные нюансы контекста при выявлении оценочных слов и выражений, что может быть использовано на всех языковых уровнях. Таким образом, исследуется каждый языковой уровень и перечисляются лингвистические аспекты, призванные усовершенствовать механизмы определения тональности текста. Завершается статья описанием будущих направлений в исследовании тональности текстов, а также той роли, которую, по мнению авторов, в этом будут играть характеристики текста и контекста.

Возросший интерес к исследованию категории субъективности, оценки и мнения может быть рассмотрен как аффективное направление в области философии и в работах по искусственному интеллекту. Кроме того, по мнению авторов, в компьютерной лингвистике также происходит смена парадигм с ориентацией на дискурс, которая выражается в росте понимания того, как разнообразные источники информации, в особенности контекстуальная информация, могут способствовать решению ряда вычислительных задач.

Первый раздел посвящен краткому обзору подходов в лингвистике, исследующих способы выражения оценки. Рассматриваются такие понятия, как позиция (position), засвидетельствован-ность (evidentiality), неверидикативность (nonveridicality), субъективность (subjectivity).

Позиция включает в себя приверженность мнению и аффект (положительную или негативную оценку). При этом определение отношения говорящего к объекту разговора (т.е. его позиции) отличается от классификации текстов по тональности, поскольку по-

следняя стремится вычленить полярность в конкретном месте текста, в то время как первое нацелено на определение позиции автора к объекту, который может и не быть открыто обозначенным в тексте. Таким образом, определение позиции может быть рассмотрено как задача соотнесения текстов по смыслу (англ. textual entailment task), поскольку позицию в некоторых случаях необходимо извлекать путем логических выводов из сказанного в тексте.

Эвиденциальность, или засвидетельствованность, охватывает языковые средства выражения отношения к знанию. Существуют три основных типа значений: надежность знания (наверняка), вид знания (думаю, предполагаю), канал получения информации (видел, слышал).

Неверидикативность включает в себя несколько явлений, называемых ирреалис, указывающих, что данное словосочетание может быть ненадежным для классификации текста по тональности. К ирреалису относятся выражения, указывающие на то, что упомянутые события не имели места на самом деле. Неверидикативность же - более широкое понятие, охватывающее все категории событий, не основанные на правде или опыте. Сюда относятся отрицание, модальные глаголы, вопросы, повелительное и сослагательное наклонения, глаголы намерения и пр. Неверидикативность отличается от эвиденциальности тем, что маркеры эвиденциальности могут кодировать неверидикативные значения помимо различных оттенков надежных выражений. Что-либо может быть представлено как факт (следовательно, надежное), но не засвидетельствовано посредством маркеров эвиденциальности. Неверидикативность имеет особое значение для классификации текстов по тональности, поскольку оценочные выражения могут вступать в разнообразные сложные взаимодействия с операторами неверидикативности (такими как отрицание, модальные глаголы, глаголы намерения).

В лингвистике понятие субъективности близко к понятию «точка зрения». Внимание авторов сфокусировано на различении субъективных и объективных утверждений. Ссылаясь на других лингвистов, Ф. Бенамара и соавторы выделяют лексические и синтаксические маркеры субъективности. К первым относятся глаголы суждения, глаголы, выражающие психические состояния, прилагательные, выражающие полярность. Синтаксические маркеры извлекаются из аннотированной вручную базы данных.

В исследуемой проблематике особое значение имеют описания образов в языке, поскольку они не разделяют лексику и грамматику. Субъективность может быть выражена как словом, так и словосочетанием или даже целой конструкцией. К образам относятся все слова, выражения и конструкции, связанные с этим словом и раскрывающие его значение. При этом можно выделять образы, непосредственно выражающие оценку, и образы, сообщающие об оценке.

Ф. Бенамара исследует оценку с позиций функциональной лингвистики, выделяя следующие функции оценки: 1) выражение мнения говорящего, 2) установление и регулировка отношений между говорящим и слушающим, 3) организация текста. Последняя функция, по-видимому, в силу ее особой нетривиальности, получила наименьшее освещение в научной литературе. Один из примеров ее реализации - аргументация.

В статье принимается следующее определение оценки: это набор средств, используемых для обсуждения эмоций, суждений и ценностей, а также средств по работе с оцениванием, в частности с его подробным описанием. Средства оценки организуются в систему оценки, которая подразделяется на три раздела: 1) отношение (attitude), 2) градация (graduation), 3) вовлеченность (engagement). В свою очередь, раздел «отношение» охватывает три аспекта: 1) эмоции (affect), 2) суждение (judgment), 3) признание (appreciation). Средства группы «эмоции» используются для истолкования эмоциональных реакций, «суждения» выражают моральную оценку говорящим характера других людей. К «признанию» относятся эстетические качества объектов и природных явлений.

Оценка пронизывает все языковые уровни, а именно: фонетический уровень через интонацию и тон; морфологический уровень посредством суффиксов (даже в таком морфологически небогатом языке, как английский); лексический уровень - в научной литературе существуют многочисленные описания специфической лексики; семантический уровень - это самый нетривиальный раздел, поскольку речь тут идет о тех выражениях, чей смысл нельзя «суммировать» на основе смыслов слов, в такое выражение входящих, и об их контекстной зависимости. Фокусирование только на одном из этих уровней, например на лексическом, приведет к неполной картине языка оценки. Именно поэтому, как считают авто-

ры статьи, необходимо дополнять метод «мешок слов» информацией из других уровней.

Во втором разделе раскрывается подход к данной проблеме с позиций компьютерной лингвистики, в первую очередь определение оценки и способы описания оценочного языка. Под языком оценки (evaluative language) понимается сегмент языка, выражающий субъективное отношение говорящего (индивидуума, группы, организации) к теме или объекту (событию, человеку, действию). При этом оценочное выражение всегда связано с поляризованной шкалой, отражающей социальные или моральные нормы. Интенсивность экспрессивного выражения вкупе с его полярностью образуют шкалу оценки (polar scale).

В компьютерной лингвистике сформировались два направления: первое основано на словарях, второе - на корпусе данных (как правило, применяется машинное обучение). При этом получил широкое распространение метод «мешок слов» (bag of words) за счет относительной простоты его внедрения. К основным проблемам «мешка слов» относят, во-первых, необходимость в аннотированной базе данных для машинного обучения, во-вторых, предметная зависимость (связанная с тем, что в текстах другой тематики словоупотребление может значительно отличаться от обучающей выборки). Для решения последней проблемы проводят адаптацию ярлыков. По сравнению с машинным обучением методы, основанные на словарях, легче могут быть перенесены в другую предметную область.

Третий раздел описывает новую динамическую модель и основания для ее создания. Научный коллектив во главе с Ф. Бенамара пришел к выводу, что язык оценки контекстозависим на трех уровнях организации текста: а) на уровне предложения -взаимодействие таких языковых операторов, как отрицание, модальность, усилители, а также изменение порядка слов, б) на уровне всего текста - соединительные слова, в) на уровне макротекста -это прагматические явления, таких как общие знания о мире, тематическая сфера, гендерная субъективность, общественные и культурные требования, ограничение во времени.

С учетом этих факторов они предложили модель, состоящую из двух блоков (Q, 3), где первый блок Q = (e, a, s, h) - тетрада внутренних характеристик языка оценки (объект - target, аспект -

aspect, эмоция - sentiment, контейнер - holder). При этом элемент «эмоции» (s) состоит из четырех субэлементов (оценочное выражение - span, категория - category, полярность - polarity, валентность - valence). Необходимо, чтобы значение s, рассматриваемое с учетом контекста было отделено от его интерпретации независимо от контекста, поскольку последнее уже относится к внешним характеристикам оценки, о чем будет сказано при описании следующего блока модели. Кроме того, полярность используется как обобщающее понятие, покрывающее любую шкалу полярности в целях расширения классической «положительной / негативной» категоризации. Полярные шкалы могут быть положительными / негативными, за / против, положительными / нейтральными / негативными или любое количество звездочек в шкале со звездами. Если любой из четырех элементов Q не вербализован, то его значение не определено. В целях простоты авторы не включают временное измерение в модель, но элемент t может быть добавлен, если это имеет значение.

Второй блок представляет собой набор функций 3 = {Fb ... , Fn}, которые учитывают внешние характеристики оценки путем приспособления или настройки базовых значений Q, когда они интерпретируются в данном контексте, так что VFj G 3, F, : Q ^ Updatei (Q). Эти функции выступают в качестве сложных операторов обновления на разных уровнях организации (предложение, текст, макротекст). Их интерпретация отражает особое значение, которое они оказывают на оценочные высказывания. Например, на уровне предложения можно создать функцию, отвечающую за роль отрицания или модальности. На уровне текста функции могут использовать связи в тексте или структуру аргументации для уточнения полярности оценки. На уровне макротекста некоторые функции могут отслеживать развитие диалога.

Работу модели можно продемонстрировать на примере: Какой классный фильм. Я был так напуган, что даже не мог пошевелиться.

Первичная интерпретация слова классный в первом предложении приводит к положительной оценке, которая не изменяется после учета внутренней характеристики полярности, т.е. Q1 = Update (Q1) = (фильм, _ , (классный, _ , +, 1), автор). Во втором предложении оценочное выражение напуган обычно трактуется как

негативное, если рассматривается вне контекста, = (фильм, _ , (напуган, _ , —, 1), автор). На уровне предложения оценка слова напуган усиливается словом так, изменяющим изначальную интенсивность оценки: ирйа.1ввепЫпсе (^2) = (фильм, _ , (так напуган, _ ,—, 2), автор). Затем, если принять во внимание первое предложение, изначальная полярность слова напуган должна быть обновлена: Updatediscourse (^2) = (фильм, _ , (так напуган, _ , +, 2), автор). Наконец, уровень прагматики сообщает нам о существовании дополнительной положительной оценки: Updatepragmatic (^2) = (фильм, _ , {(так напуган, _ ,+,2), (даже ... пошевелиться, _ ,+, 2)}, автор).

Таким образом, была создана модель, динамичная и чувствительная к контексту. В следующих двух разделах описываются такие направления учета контекста, как: а) расширение модели «мешок слов» с помощью учета контекстуальной информации, б) использование теорий и наработок лингвистики наряду со статистической обработкой данных.

В пятом разделе проблема классификации текстов по тональности представлена как движение снизу вверх, от уровня слова до уровня контекста. Подробно описывается, как эмоции могут быть вербализованы в рамках слова, фразы и предложения. Большинство исследований нацелены на расширение словаря или адаптацию алгоритма к новому языку или новой предметной области. Ф. Бенамара и соавторы остановили свое внимание на немногочисленных исследованиях, стремящихся вывести классификацию на качественно новый уровень. Такие работы, упрощая, можно разделить по тому основанию, как в них обрабатываются такие языковые явления, как интенсивность, экспрессивность, а также принципы тональной классификации.

Как известно, один из способов улучшить тональную классификацию - привязывать каждое экспрессивное слово к шкале оценки или уровню интенсивности. Методы автоматического поиска соответствующего места для слов на шкале включают методы, основанные на грамматике образов или использующие методологию корпусной лингвистики.

Другой способ улучшить определение полярности заключается в учете (помимо полярности и / или интенсивности) информации о семантической категории экспрессивного выражения. Категории могут быть установлены в соответствии с основанными на

психологии классификациями эмоций, стремящимися описать акты оценки в рамках базовых эмоций, таких как гнев, страх, удивление, любовь. Также, по мнению авторов, следует опираться на такие базы данных, как WordNet-Affect и MPQA, комбинируя их для большего покрытия лексики. Последнее, однако, может привести к разночтению полярности отдельных слов.

Что касается принципов классификации, существуют как чисто семантические классификации (MPQA), так и комбинированные (семантико-синтаксические). В последних учитывается синтаксическая структура, в которую встроены экспрессивные выражения, поскольку она позволяет различать разные классы значений. Несмотря на то, что семантическая классификация не получила широкого применения для классификации текстов по тональности, Ф. Бенамара и коллеги рассчитывают с ее помощью улучшить работу современных подходов класса «мешок слов».

Термин «шифтеры валентности» (valence shifters) используется для описания того, как значение экспрессивного выражения может быть изменено контекстом, включая пресуппозицию, иронию, приглушение или увеличение интенсивности. Работа с шиф-терами валентности включает в себя три подзадачи: 1) детекция шифтеров и их зоны действия; 2) анализ их воздействия на оценку; 3) учет этого воздействия для актуализации результатов тональной классификации. Для первой из этих подзадач используются парсе-ры предложений или парсеры зависимостей.

Для решения второй учитываются интенсификаторы, которые чаще всего оказываются прилагательными или наречиями степени или образа действия. Адекватное отображение воздействия интенсификатора предоставляет шкала оценки. Помимо интенси-фикаторов учитываются сверхсинтагматические значения, такие как неверидикативность, эпистемическая модальность, ирреалис. Считается, что экспрессивные выражения, попадающие под влияние перечисленных явлений, теряют релевантность для тональной классификации. Еще один аспект представляет собой отрицание, которое может выражаться даже без использования отрицательных слов. В некоторых языках повтор отрицания может сводить на нет эффект отрицания. Отдельный интерес в отрицании представляет его маркированность.

Третья задача - вычисление значения тональности выражения с учетом воздействия шифтеров валентности - может быть построена на принципе композиционности. Предварительным шагом должен быть синтаксический парсинг для определения сферы влияния шифтеров. Определенную эффективность в этом показывает применение набора эвристических правил. Но они зависят от языка и предметной области. Альтернативой будет представление каждого узла в дереве парсинга в виде вектора и затем ориентирование каждого из листьев-векторов в сторону корня.

Шестой раздел посвящен аспектам, которые станут ключевыми в будущих аналитических системах тональности: анализ на уровне текста, скрытая оценка, образный язык, экстралингвистическая информация и детекция интенций.

В классификации текстов по тональности особую роль играет связность текста, соединяя текущее предложение и текст целиком. Языковые явления, раскрывающиеся в рамках всего текста, особенно важны для решения трех задач: 1) определения ориентации оценочных выражений; 2) поиска свидетельств о наличии скрытой оценки; 3) определения позиции говорящего, выраженной в тексте в целом.

Существуют два направления, использующие явления на уровне текста: направление «сверху вниз» и направление «снизу вверх». Подходы «сверху вниз» выстраивают либо тематическую структуру, либо функциональную. Тематическое структурирование отталкивается от того, что тема и словоупотребление (повторение слов, связность текста, парадигматические отношения) связаны друг с другом. При функциональном структурировании текст рассматривается в свете коммуникативных ролей или коммуникативного намерения говорящего. Также в подходах «сверху вниз» при классификации текстов по тональности считается, что не все части текста одинаково влияют на формирование тональности текста: особое значение придается конечной позиции текста. Рассматриваются исследования различных лингвистов в рамках этого подхода.

Другой аспект подхода «сверху вниз» - аргументация. Детекция аргументации - новая сфера исследований в обработке естественного языка, в рамках которой сформировались три направления. Первое опирается на список маркеров, соединяющих соседние посылки и разделяемых на две группы: маркеры под-

держки и маркеры атаки. Во втором направлении применяется обучение с учителем для определения, является ли данное высказывание составляющей аргументации или нет. На следующей ступени аргументы разделяются на посылки и заключения, а если это посылка, то поддерживает ли она заключение или опровергает его. Третье направление использует смену темы как индикатор смены в аргументативной цепочке. В рамках классификации текстов по тональности аргументация улучшает точность классификации полярности текста.

Подходы «снизу вверх» можно разделить на два течения в исследовании связей в тексте: первое дает частичное покрытие текста, в то время как второе ставит целью охватить весь текст. Частичное покрытие текста вытекает из ориентации исключительно на союзы (элементы текста, не связанные союзами, не попадают под действие алгоритма). Полное покрытие текста требует аннотирования текста целиком с построением в виде деревьев (теория риторических структур - rhetorical structure theory) или графов (теория репрезентаций сегментированного текста - segmented discourse representation theory).

Эксперименты по использованию информации такого рода в классификации текстов по тональности формируют две группы:

1) опирающиеся на связи между предложениями и 2) использующие информацию о структуре всего документа, полученной от пар-серов или в результате ручной аннотации.

Исследователи, проводящие эксперименты в рамках первой группы, пришли к выводу, что не все связи между предложениями одинаково важны для тональной классификации: некоторые предлоги и союзы могут изменять полярность, скрывать или уменьшать степень интенсивности. Есть работы, использующие набор предлогов в качестве параметров для модели «мешок слов», что приводит к улучшению качества классификации. Использование структуры всего текста может помочь при ранжировании сегментов текста: приписывании им определенного веса или разделении на ядерные и периферийные. Но опора только на связи между соседними предложениями приводит к следующим проблемам: 1) остаются незамеченными связи с имплицитными или многозначными маркерами;

2) объяснительной силы такого подхода не хватает для адекватной

трактовки контекстуального сдвига валентности; 3) связи между отдаленными элементами текста остаются неохваченными.

По аналогии с импликатурой речевого общения Грайса, скрытая оценка может рассматриваться как импликатура мнения. Другой способ реализации скрытой оценки - просодия дискурса, также называемая оценочной просодией, под которой понимаются смыслы, вербализованные в одном месте текста, но окрашивающие значительную часть текста доминирующими словами из семантического поля, к которому они принадлежат. Выделяются три основных способа выражения скрытой оценки. В рамках первого способа описываются желательные или нежелательные события, которые используются в контрастной по вербализованным в ней полярностям конструкции [VP+].[Situation—]. Второй способ связан с объективными словами, имеющими положительную или отрицательную коннотацию. Выработан алгоритм, позволяющий построить обширный словарь коннотаций, в отличие от тонального словаря. Третий способ касается ситуаций, когда оценивается имплицитное свойство какого-либо объекта. Эта проблема часто затрагивается в аспектно-ориентированной классификации тональностей. Выявление скрытого упоминания свойств из предложений требует выявления указаний на их существование. Когда такие маркеры найдены, используются методы кластеризации для соотнесения маркеров с соответствующими свойствами.

Образный язык охватывает достаточно большой спектр языковых явлений. Приобрела популярность задача детекции иронии в целях повышения качества классификации текстов по тональности. При изучении социальных сетей в машинном обучении с учителем используются хэштеги #1гопу, #8агса8ш, #8агса8йс, хотя и такой метод не лишен подводных камней. Например, при разграничении иронии и сарказма, последнее явление чаще характеризуется наличием субъективных выражений вообще и слов с положительными коннотациями, в частности. Выявить иронию (или сарказм) в тексте можно двумя способами: опираться только на ориентиры в рамках данного высказывания или включать, помимо этого, информацию в контексте. В первом случае говорящий сочетает слова, которые либо обладают противоположной полярностью, либо не сочетаются семантически. Во втором получают значимость не только элементы внутри предложения (п-граммы, эмотиконы,

пунктуация, цитаты, слэнг, слова из тональных словарей), но и языковые явления прагматического уровня, раскрывающиеся на уровне контекста, такие как: риторические вопросы, оппозиция, уровень вежливости, семантическая близость концептов, использование общеупотребительных и редких синонимов и т.д. В некоторых работах по исследованию социальных сетей также учитываются информация об авторе, его аудитория и предыдущие сообщения, нить сообщений, в которую входит исследуемое сообщение.

Точность классификации текстов по тональности повышается, если учитываются демографические данные. Например, выделяются слова, которые приобретают экспрессивное значение только у мужчин, слова, специфичные для женщин. Кроме того, принадлежность говорящего к определенной группе в социальной сети предполагает схожую оценку событий, что может уточнить работу классификатора.

Отпочковавшейся от анализа тональности сферой исследований является детекция интенций, приобретающая особую актуальность для веб-рекламы и маркетинга. К интенциям относят желания, предпочтения и намерения. Для выявления в речевом продукте желаний был создан алгоритм, выделяющий пожелания к изменению продукта и желание купить тот или иной продукт. Извлечение из текста предпочтений происходит в два этапа: сначала устанавливаются объекты сравнения, сравнительное слово и сравниваемые свойства, а затем определяется предпочитаемый вариант. Определение по тексту намерения тоже является одной из задач классификации. Из-за высокой предметной зависимости был предложен алгоритм переноса в новую предметную область с обучением. Таким образом, детекция интенций может быть рассмотрена как вспомогательная для задачи тональной классификации.

Последний раздел содержит предположения о том, какие направления исследований тональной классификации окажутся плодотворными в ближайшие годы. Так, следует сочетать лингвистические и статистические методы, например, использовать в качестве некоторых характеристик «мешка слов» особенности дискурса. Характеристики контекста могут быть использованы для выявления скрытой оценки и для более адекватной трактовки значения образных выражений.

Реферируемая работа дает многосторонний обзор аспектов проблемы классификации текстов по тональности и решений в данной области исследований, содержит ссылки на 411 научных трудов последних лет.

Н.Е. Маслова

КОММУНИКАЦИЯ. ДИСКУРС. РЕЧЕВЫЕ ЖАНРЫ

2018.01.018. НИКИТИНА ЕС. СМЫСЛОВОЙ АНАЛИЗ ТЕКСТА: Психосемиотический подход. - М.: ЛЕНАНД, 2016. - 200 с.

Ключевые слова: текст как знак; понимание; интерпретация; коммуникативная парадигма; семиотика; психосемиотический подход; смысл.

В реферируемой монографии, автором которой является Елена Сергеевна Никитина - канд. филол. наук, ведущий научный сотрудник отдела психолингвистики Института языкознания Российской академии наук, представлены результаты исследования, посвященного психосемиотической модели смыслового анализа текста, в основе которой такие понятия, как текст, смысл, понимание. В монографии показано, что смысл в отличие от содержания фиксирует функциональную, субъективную составляющую содержания: как читатель видит и воспринимает обозначенную в тексте действительность. Содержание не может быть нейтральным, поскольку оно отражает видение конкретных лиц для определенной аудитории в отношении воспроизведенного описания реальности. Текст при этом является посредником и носителем определенной точки зрения в коммуникативных ситуациях. Смысл тесно связан с пониманием и интерпретацией. В первом случае речь идет об обнаружении в тексте его собственных смыслов; во втором - о погружении содержания текста во внешний (читательский) контекст.

В реферируемой работе описываются смысловые фокусировки текста как знака с собственным содержанием и предлагаются технологии извлечения текстовых смыслов. Результаты исследования, изложенные в монографии, предназначены для разработчиков новых поисковых программ; учителей-методистов, занимающихся созданием текстов; экспертов-текстологов, технологов понимания текста; переводчиков и всех интересующихся строением текста.

i Надоели баннеры? Вы всегда можете отключить рекламу.