Научная статья на тему 'Методы выделения ключевых слов при реферировании научного текста'

Методы выделения ключевых слов при реферировании научного текста Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
2447
213
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕФЕРИРОВАНИЕ / НАУЧНЫЙ ДИСКУРС / КАТЕГОРЕМАТИЧЕСКИЙ КОМПОНЕНТ ЗНАЧЕНИЯ СЛОВА / ПОНИМАНИЕ ТЕКСТА / RENDERING / SCIENTIFIC DISCOURSE / CATEGORICAL COMPONENT OF THE WORD MEANING / TEXT COMPREHENSION

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Москвитина Татьяна Николаевна

Рассматривается вопрос о методиках выделения ключевых слов в научных текстах юридического дискурса в процессе создания вторичных документов (рефератов) для обеспечения быстрого и эффективного поиска необходимой информации. Представлен обзор современных подходов к извлечению ключевых слов в тексте отечественной и зарубежной литературы. Во второй части работы предложена методика, сочетающая элементы статистических, эвристических, лингвистических методов для выделения ключевых (опорных) слов научного текста. Акцент делается на том, что формальных признаков (частотность, совместная встречаемость) слов недостаточно для того, чтобы быть отнесенными к категории ключевых, позволяющих эффективно передать смысл реферируемого текста. Обосновывается необходимость лингвистического анализа лексических единиц, выделенных на основе формальных признаков, позволяющего раскрыть концептуальную структуру слова и выделить категорематические компоненты его значения, позволяющие составить метаязык для описания смысла реферируемого научного текста и способствовать передаче максимального количества информации минимальным набором ключевых слов. Приводятся результаты анализа вторичных текстов юридического содержания, содержащих набор категорематичеcких элементов ключевых слов текста, позволяющих описать смысл реферируемого текста.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

KEYWORD DISTINGUISHING METHODS IN THE PROCESS OF SCIENTIFIC TEXTS RENDERING

The article deals with the problem of adequate keyword distinguishing from scientific texts in order to retain the meaning of the text and to lessen the risk of misinterpretation of information rendered by it. There is a great need for the effective methods of automatic keyword extraction due to the excessiveness of the data. The article presents the review of up-to-date approaches to text rendering and keyword distinguishing in foreign and Russian research. This research is essential for further investigation of the problem as it shows the advantages and disadvantages of the approaches found. The existing methods are subdivided into four groups: statistical approaches, natural language processing, machine training methods, hybrid methods combining the above mentioned three groups. The second part of the article presents a hybrid method for extracting keywords from scientific texts in the process of rendering law texts. It employs statistical and empiric approaches at its beginning taking into consideration the formal features of keywords (frequency, information weight, position). The next stages include linguistic methods of lexico-semantic analysis, building of word chains, the part-of-speech analysis. The final stage of extracting the categorical component of the meaning of the keywords is essential for describing the concept of the text and allows to restore the meaning of the whole text out of the few keywords. The research presents a list of categorical components of keywords extracted from abstracts of scientific texts of law discourse, which is the result of the application of the suggested method.

Текст научной работы на тему «Методы выделения ключевых слов при реферировании научного текста»

УДК 81'42

DOI: 10 .23951/1609-624Х-2018-8-45-50

МЕТОДЫ ВЫДЕЛЕНИЯ КЛЮЧЕВЫХ СЛОВ ПРИ РЕФЕРИРОВАНИИ НАУЧНОГО ТЕКСТА*

Т. Н. Москвитина

Южно-Уральский государственный гуманитарно-педагогический университет, Челябинск

Рассматривается вопрос о методиках выделения ключевых слов в научных текстах юридического дискурса в процессе создания вторичных документов (рефератов) для обеспечения быстрого и эффективного поиска необходимой информации. Представлен обзор современных подходов к извлечению ключевых слов в тексте отечественной и зарубежной литературы. Во второй части работы предложена методика, сочетающая элементы статистических, эвристических, лингвистических методов для выделения ключевых (опорных) слов научного текста. Акцент делается на том, что формальных признаков (частотность, совместная встречаемость) слов недостаточно для того, чтобы быть отнесенными к категории ключевых, позволяющих эффективно передать смысл реферируемого текста. Обосновывается необходимость лингвистического анализа лексических единиц, выделенных на основе формальных признаков, позволяющего раскрыть концептуальную структуру слова и выделить категорематические компоненты его значения, позволяющие составить метаязык для описания смысла реферируемого научного текста и способствовать передаче максимального количества информации минимальным набором ключевых слов. Приводятся результаты анализа вторичных текстов юридического содержания, содержащих набор категорематических элементов ключевых слов текста, позволяющих описать смысл реферируемого текста.

Ключевые слова: реферирование, ключевые слова, научный дискурс, категорематический компонент значения слова, понимание текста.

В современном информационном пространстве в условиях постоянного наращивания объемов текстов проблема продуктивного поиска и быстрого ориентирования в массе текстов стоит особенно остро. Умение человека сориентироваться и с наименьшими потерями времени найти действительно ту информацию, которая ему необходима, обусловливает его успех в различных сферах деятельности. В настоящее время даже специалисту достаточно узкой предметной области сложно найти необходимую информацию. Одна из актуальных задач в связи с этим - совершенствование новых методов и подходов к автоматическому реферированию и экстрагированию ключевых слов, поиск моделей выделения ключевых слов научного текста с использованием данных лексико-семантического, дискурсивного анализа, элементов морфологического, синтаксического и словообразовательного анализа, статистического подхода. Следовательно, качественное представление смысла текста в виде минимального набора лексических единиц является актуальной проблемой, решаемой методами статистики, лингвистики, автоматического распознавания и реферирования текстов.

В последнее время проблема сжатия текстовых массивов для оптимизации ориентирования в информационном пространстве разрабатывается учеными разных стран, использующих данные

компьютерной лингвистики, психолингвистики, автоматизированных систем, графов, дискурсивной, корпусной лингвистики. Процесс реферирования текста неразрывно связан с вычленением ключевых (опорных) слов (КС) текста, поскольку именно то, насколько грамотно определены и выделены КС текста, и обеспечивает передачу информации от отправителя сообщения к потенциальному реципиенту.

Текст, рассматриваемый в рамках теории информации, помогает раскрыть специфику языковой личности - автора сообщения, так как текст сам по себе - это информационно законченное речевое сообщение, задуманное и сориентированное автором сообщения для своего адресата, способного на понимание и извлечение максимального количества информации. В тексте как форме коммуникации содержатся единицы, сигналы, иные средства для построения более краткой его модели без потери информативности. В процессе понимания содержания текста идет извлечение информации, знаний, что требует от получателя особых приемов обработки языкового материала, происходящих не только на рациональном уровне, но и на уровне эмоций, ассоциаций, оценок. Понимание текста стимулирует когнитивные структуры, что позволяет извлечь новое, способствует интерпретации, анализу, творческой переработке текста.

* Работа выполнена при финансовой поддержке ФГБОУ ВО «Мордовский государственный педагогический институт им . М . Е . Евсевьева» по договору на выполнение НИР от 04 .06 .2018 г . № 1/326 по теме «Когнитивные и коммуникативные факторы репрезентации действительности в разных типах англоязычного дискурса» .

Таким образом, информативность - это неотъемлемое свойство любого текста. Существенную часть смысла текста составляет информация. Но разница между информативностью художественного текста и научного текста состоит в том, что научный текст должен передавать информацию эксплицитно, в художественном тексте информацию нужно извлекать не столько из контекста, сколько из подтекста.

При каждом акте коммуникации отправитель выбирает из определенного «набора» некоторое количество знаков и, располагая их по установленным правилам, передает их по «каналу» связи (в пространстве и времени) реципиенту, который, осуществив прием знаков, идентифицировав их с помощью имеющегося у него перечня (кода), воспринимает формы, закономерности и значения, содержащиеся во множестве этих знаков, и помещает их в свою память [1]. Элемент сообщения, которого нет в наборе получателя, не будет воспринят как знак, он будет пропущен. Уровень понимания текста будет зависеть от информационной значимости «пропущенного» элемента в тексте: если этот элемент относится к тематическим, ключевым словам текста, то уровень понимания будет обратно пропорционален степени важности данных элементов в смысловой структуре текста.

Целью данной работы является изучение основных современных методов экстрагирования ключевых слов при сжатии научного текста либо при составлении вторичных научных документов (рефератов научных статей), а также разработка собственной методики, применимой для вычленения ключевых слов научного текста.

В ходе исследования современных работ отечественных и зарубежных исследователей были выявлены следующие направления: 1) статистические методы [2]; 2) лингвистические методы [2-4]; 3) машинные методы [2, 3]; 4) гибридные/смешанные методы [2]. Группа статистических методов включает в себя простые математические методы обработки нелингвистических признаков документа: а) расположение слов в тексте; б) частотность употребления терминов [2, 3]; в) обратная частотность в документе; г) коэффициент относительной частотности; д) совместная встречаемость лексических единиц [2, 3]; е) информативный «вес» термина [3]. Наиболее часто применяемый в автоматизированных системах метод - частотный анализ, который дополняется в различных методиках другими параметрами. При кажущейся простоте применения и автоматизации данных методов результаты не оправдывают ожиданий, поскольку статистические методы не позволяют достоверно определить информационную значимость слов, а следовательно, список КС текста не может быть достоверным.

Следующая группа методов - лингвистическая, использует дискурсивный [4], лексико-семантиче-ский [3], морфологический, структурный и синтаксический анализ текста [2]. Ресурсами для проведения данных исследований являются электронные словари, лексические цепочки, частеречные модели.

Методы машинной обработки текстов включают обучающие модели: алгоритм KEA (Keyword extraction algorithm), GenEx.

Гибридные модели используют сочетание двух-трех групп методов и добавляют эвристические (расположение в тексте, длина слова, формальные признаки, теги HTML вокруг слов) [2, 3].

Таким образом, обзор исследуемых методов выделения КС научного текста показал, что проблема экстрагирования КС требует дальнейших разработок методик и их сочетания для получения важных с точки зрения смысла КС.

Ввиду того, что понимание любого речевого произведения имеет своей целью проникновение в смысл, формируемый на основе свернутой, явно не выраженной концептуальной структуры, полнота выводимой информации находится в тесной зависимости от объема лингвистических, энциклопедических, фоновых знаний реципиента, его опыта и принадлежности к той или иной культурной общности. Следовательно, данный процесс предполагает множественность трактовок, возникающих в процессе восприятия и интерпретации. Концептуальная структура текста выступает в виде константного сжатого смыслового ядра текста, которое извлечено из его КС, их ассоциативных связей и импликаций, и которое обязательно должно быть неизменным при всех изменениях содержания интерпретаторами.

В результате исследования существующих методик по выделению КС текста была разработана методика, сочетающая эвристические, статистические и лингвистические подходы к данной проблеме. Данная методика была использована для анализа юридического англоязычного дискурса. В методике выделяется несколько этапов:

1. Определение набора сильных позиций научного текста при помощи механизма «удобного свертывания» текста [5]. Среди сильных позиций выделяются:

- заголовок, поскольку тема - это эксплицитно выраженный замысел, основная идея текста автора;

- инициальное предложение произведения;

- конечное предложение текста;

- имена участников событий;

- основное место разворачивания сюжета произведения.

2. Просмотровое чтение с целью поиска предложений с маркерами, индикаторами, коннектора-

ми [6]. Осуществляется анализ при помощи словарей маркеров, индикаторов, коннекторов. Маркеры (по терминологии В. А. Яцко) - «слова и словосочетания, однозначно выражающие тот или иной аспект текста первичного документа» [6, с. 19]. Индикаторы указывают, какие именно предложения автор делает наиболее значимыми, но не связаны ни с одним аспектом текста. Индикаторы можно рассматривать как эксплицированное намерение автора привлечь внимание читателя к важности высказывания или лексической единицы (as a result; therefore; otherwise, nevertheless...).

Коннекторы выделяют предложения, так или иначе связанные с маркированными. К коннекторам можно отнести:

а) указательные и личные местоимения, слова-заместители (thatdecision; it_can be terminated);

б) слова и выражения, сигнализирующие о том, что предложение, частью которого они являются, конкретизирует содержание маркированных предложений (also; then; for example; moreover; furthermore .).

Экстрагирование на этом этапе проводится с использованием словаря маркеров и индикаторов и включает этапы: 1) просмотровое чтение первичного документа и 2) поиск предложений, содержащих маркеры. В случае недостаточного количества подобных предложений выделяются предложения с индикаторами и даже с коннекторами [7]. При этом типе реферирования язык первоисточника сохраняется, перифраз не применяется.

3. Определение цели создания текста через изучение логики развития замысла, выделение таких аспектов, как выводы, рассуждения, заключение, рекомендации (если таковые имеются в тексте). Извлечение из текста предложений, содержащих эти аспекты. Данный этап целесообразен при составлении вторичных документов по научным статьям.

4. Выявление (при помощи словаря-тезауруса) ближайшего синонима лексической единицы, являющейся темой текста; сопоставление данных энциклопедических, толковых, терминологических словарей; построение синонимического ряда для лексемы, вербализующей тему научного текста.

Необходимость данного этапа методики объясняется тем, что связность текста, по мнению Н. М. Ра-зинкиной, достигается через единство темы и авторского замысла на уровне логики, семантики и грамматики [8], в то время как целостность текста образуется его тематической структурой. Другими словами, тема целого текста - это и есть «смысловое ядро» [8], понимаемое как обобщенный концентрат всего сжатия текста. Тема научного текста обретает языковой статус, когда она способна выявить определенный набор типизированных языковых признаков, способных передать обобщенный смысл.

5. Определение наиболее важных слов научного текста. Для этого этапа используются статистические методы и частотные словари, возможно использование компьютерных программ:

а) подсчет количества словоупотреблений в тексте, определение наиболее часто используемых слов текста;

б) выявление языковой частотности наиболее часто употребляющихся в данном тексте лексических единиц и словосочетаний с помощью данных частотного словаря;

в) вычисление коэффициента важности слова для последующего выявления наиболее ценных слов данного текста при помощи формулы:

Кваж= Х • т / N • п, где Х - частота словоупотреблений в тексте; т -число предложений текста, в которых встретилось слово; N - общее число словоупотреблений в тексте, п - общее число предложений в тексте.

6. Выявление внутритекстовых связей наиболее часто встречающихся ЛЕ и словосочетаний текста (используется метод симметричного реферирования и теория пересечения значений) [6] с целью определить иерархию выделенных слов, разделив КС на главные и второстепенные. Построение лек-сико-тематической цепочки [9] (сетки) реферата с последующим экстрагированием наиболее информативных предложений.

7. Элиминирование личных, указательных местоимений, семантических повторов, служебных слов, коннекторов, индикаторов, уточнений, широ-козначных слов, получение набора КС текста.

8. Дальнейшее «сжатие» полученного списка слов и словосочетаний, посредством отождествления лексических единиц, имеющих одинаковые корневые морфемы.

9. Определение концептуальной структуры КС текста и выделение категорематического элемента в структуре КС при помощи метода семантических множителей и данных терминологических, энциклопедических, толковых словарей для получения экстрагированного смысла/концепта научного текста.

КС имеют план выражения и план содержания. Концептуальная структура слова вычленяется из его семантической структуры как совокупность семантических множителей, закрепленных за всеми лексико-семантическими вариантами одного слова. Концептуальная структура слова включает сигнификативный компонент значения, но не исчерпывается им. Необходимость выделения концептуальной структуры слова обусловливается отсутствием в ней категориальных признаков, свойственных целым классам слов. Семантическая структура слова содержательно и структурно сложнее концептуальной. Семантическая структура образуется множеством его лексико-семантических вариан-

тов, а концептуальная структура - множеством его семантических множителей (или набором его дифференциальных и недифференциальных признаков). Концептуальное содержание семантического множителя имеет языковую природу, оно обусловлено способом восприятия и освоения объективной действительности. В концептуальной структуре слова можно выделить следующие составляющие: «семантические категории, эксплицируемые парами противопоставленных существительных, порядок их следования, интенсивность, оценоч-ность, знак оппозиции» [10, с. 23]. Данные составляющие неравноценны. Они делятся на два подтипа: категорематические элементы и синкатегоре-матические [11, с. 37]. Термин «категорематиче-ский», или предикативный (от греч. «категорема» - предикация), обозначает «тот, который самостоятельно может быть как субъектом, так и предикатом суждения». Категорематический знак - законченное выражение представления, суждения, чувства, утверждения, просьбы, приказа и т. п. [12]. К категорематическим элементам в данной работе относим элементы, обладающие собственным содержанием (в данном случае существительные названия множителей), к синкатегорематическим -элементы, не имеющие самостоятельного существования (это свойства существительных и принципы их организации, те слова, которые без существительного не могут обозначать или являться субъектом к предикатам высказывания (например, some, any). Синкатегорематический знак получает полное значение лишь в случае связи с другим значением.

Описание значения основывается на интегральном принципе (т. е. перечислении тех компонентов, на которые можно разложить описываемый смысл) и дифференциальном принципе (указание на то, чем один смысл отличается от остальных). Таким образом, разложив КС на компоненты, мы получим метаязык для описания смысла текста.

В процессе применения методики выделения КС на вторичных научных документах юридического дискурса были найдены наборы ключевых слов (в количестве от 5-7, что соответствует объему оперативной памяти человека). В качестве материала исследования служили рефераты научных статей, рефераты (abstracts) судебных решений и приговоров. С помощью метода семантических множителей и данных терминологических, энциклопедических, толковых словарей была определена концептуальная структура КС текстов и выделен категорематический элемент. На данном этапе исследования из научных текстов юридического содержания выявлено 44 категорематических элемента, относящихся к правовому полю и позволяющих описать смысл минимальными лексически-

ми средствами: Legality/illegality; Right/duty; Privilege/equality; Finality/non-fmality; Justice/ injustice; Power/liability; Guilt/innocence; Defence/ prosecution; Law/crime/offense; Person/Group; Charge/discharge; Consent/dissent; Prohibition; Deceit/honesty; Conduct; Judgement; Concealment; Violence; Punishment; Claim; Management; Court; Ideology; Inquiry; Observance/non-observance; Measure; Intention; Proof; Argument. Среди выделенных элементов встречаются антонимичные пары (Right/duty; Privilege/equality; Finality/non-finality; Justice/injustice; Power/liability), что отражает сущность юриспруденции, регламентирующей и противопоставляющей деяния в соответствии с законом.

Например, слово indictment - a formal claim of criminal wrong doing against a person [13] - имеет следующие семантические множители: claim, prosecution, crime, court, non-finality. Слово verdict - the finding or decision of a jury on the matter submitted to it in trial [13] - имеет семантические множители - justice/injustice, judgement, finality, court.

Полученные категорематические элементы КС текста представляют собой экстрагированный план содержания наиболее важных лексических единиц вторичного юридического текста. Семантическая структура плана содержания текста определяется конфигурациями конкретных языковых значений (связанных с определенными формальными показателями) в их речевых реализациях. Что же касается смысла текста, то структура смысла определяется собственно семантическими единицами и отношениями между ними. Выделенный нами кате-горематический элемент значения слова будет являться единицей метаязыка для описания смысла юридического научного текста, который формируется на основе свернутой, явно не выраженной смысловой структуры, и будет составлять общий фонд элементов, характеризующих именно научные тексты юридического дискурса. Полученный набор КС оптимизирует процесс поиска необходимой информации специалисту данной области знания и тоже является своеобразным кодом, при этом обеспечивает эффективную передачу информации.

Таким образом, результатом настоящего исследования явился обзор современных методик реферирования научного текста и разработка собственной методики смыслового сжатия научного текста с конечной целью - максимально точно описать смысл реферируемого научного текста на минимальном пространстве с использованием минимальных лексических средств. Данная методика учитывает тот факт, что концептуальная структура текста предстает как встречное движение от концепта к ключевому слову и от слова и фразеологиз-

ма в сложной системе смысла текста к концепту как элементу тезауруса человека. Описанная выше методика может быть применена при составлении программ, автоматически синтезирую-

щих вторичные документы из набора ключевых слов при условии применения данных лингвистических, энциклопедических, частотных словарей и тезаурусов.

Список литературы

I. Моль А. Социодинамика культуры . М .: КомКнига, 2005 . 416 с .

2 . Bharti Santosh Kumar, Babu Korra Sathya, Pradhan Anima . Automatic Keyword Extraction for Text Summarizationin Multi-document e-

Newspapers Articles // European Journal of Advances in Engineering and Technology. 2017 . Vol . 4, is. 6 . Р . 410-427 . URL: http://www.ejaet.com/

PDF/4-6/EJAET-4-6-410-427 . pdf (дата обращения: 15.08.2018) .

3 . Haggag, Mohamed H . Keyword Extraction using Semantic Analysis // International Journal of Computer Applications (0975 - 8887) . January

2013 .Vol .61, № 1. URL: https://pdfs . semanticscholar. org/1b09/c3dc05e4c19c44969a06c5509123ad2f5158 . pdf (дата обращения: 13 .08.2018) .

4 . Hulth Anette . Improved Automatic Keyword Extraction Given More Linguistic Knowledge // EMNLP '03 Proceedings of the 2003 conference on

Empirical methods in natural language processing, Association for Computational Linguistics . 2003. Р . 216-223 . URL: http://www. aclweb . org/

anthology/W03-1028 (дата обращения: 12 .08.2018) .

5 . Костомаров В . Г . , Бурвикова Н . Д . Прецедентный текст как редуцированный дискурс // Язык как творчество . К 70-летию В . П . Григорьева:

сб. науч . тр . М .: ИРЯ РАН, 1996 . С . 297-302 .

6 . Яцко В . А. Симметричное реферирование: теоретические основы и методика // НТИ . 2002 . Сер . 2 . № 5 . С . 18-27 .

7 . Блюменау Д . И . Информационный анализ/синтез для формирования вторичного потока документов . СПб .: Профессия, 2002 . 235 с .

8 . Разинкина Н . М . Функциональная стилистика (на материале английского и русского языков): учеб . пособие . М .: Высшая школа, 2004. 271 с .

9 . Ercan G ., Cicekli . I . Using lexical chains for keyword extraction // Information Processing & Management. 2007 . Vol . 43 (6) . Р . 1705-1714 .

URL:https://www sciencedirect . com/science/article/abs/pii/S0306457307000398 (дата обращения: 19 .08.2018) .

10 . Шехтман Н . А . Системность лексики и семантика слова: учеб . пособие к спецкурсу . Куйбышев: Куйбышев, 1988. 84 с .

II. Чёрч А. Введение в математическую логику. М .: Либроком, 2009 . Т . 1. 482 с.

12 . Гуссерль Э . Логические исследования . СПб .: Академический проект, 2011. Т . 2 . 576 с .

13 . Longman Dictionary of Contemporary English . Harlow, Pearson Education Ltd . , 2005. 1950 p .

Москвитина Татьяна Николаевна, старший преподаватель, Южно-Уральский государственный гуманитарно-

педагогический университет (пр. Ленина, 69, Челябинск, Россия, 454080). E-mail: moskvitinatn@cspu.ru

Материал поступил в редакцию 22.08.2018.

DOI: 10 .23951/1609-624X-2018-8-45-50

KEYWORD DISTINGUISHING METHODS IN THE PROCESS OF SCIENTIFIC TEXTS RENDERING

T. N. Moskvitina

South Ural State Humanitarian Pedagogical University, Chelyabinsk, Russian Federation

The article deals with the problem of adequate keyword distinguishing from scientific texts in order to retain the meaning of the text and to lessen the risk of misinterpretation of information rendered by it. There is a great need for the effective methods of automatic keyword extraction due to the excessiveness of the data. The article presents the review of up-to-date approaches to text rendering and keyword distinguishing in foreign and Russian research. This research is essential for further investigation of the problem as it shows the advantages and disadvantages of the approaches found. The existing methods are subdivided into four groups: statistical approaches, natural language processing, machine training methods, hybrid methods combining the above mentioned three groups. The second part of the article presents a hybrid method for extracting keywords from scientific texts in the process of rendering law texts. It employs statistical and empiric approaches at its beginning taking into consideration the formal features of keywords (frequency, information weight, position). The next stages include linguistic methods of lexico-semantic analysis, building of word chains, the part-of-speech analysis. The final stage of extracting the categorical component of the meaning of the keywords is essential for describing the concept of the text and allows to restore the meaning of the whole text out of the few keywords. The research presents a list of categorical components of keywords extracted from abstracts of scientific texts of law discourse, which is the result of the application of the suggested method.

Key words: rendering, keywords, scientific discourse, categorical component of the word meaning, text comprehension.

References

I. Mol' A . Sotsiodinamika kul'tury [Sociodynamics of culture] . Moscow, KomKniga Publ . , 2005. 416 p . (in Russian) .

2 . Bharti Santosh Kumar, Babu Korra Sathya, Pradhan Anima . Automatic Keyword Extraction for Text Summarization^ Multi-document e-

Newspapers Articles . European Journal of Advances in Engineering and Technology, 2017, vol . 4, issue 6, pp . 410-427 . URL: http://www. ejaet . com/PDF/4-6/EJAET-4-6-410-427 . pdf (accessed 15 August 2018) .

3 . Haggag Mohamed H . Keyword Extraction using Semantic Analysis . International Journal of Computer Applications (0975-8887), January 2013,

vol . 61, no . 1. URL: https://pdfs. semanticscholar. org/1b09/c3dc05e4c19c44969a06c5509123ad2f5158 . pdf (accessed 13 August 2018) .

4 . Hulth Anette . Improved Automatic Keyword Extraction Given More Linguistic Knowledge . EMNLP '03 Proceedings of the 2003 conference on

Empirical methods in natural language processing, Association for Computational Linguistics, 2003. pp . 216-223. URL: http://www. aclweb . org/ anthology/W03-1028 (accessed 12 August 2018) .

5 . Kostomarov V. G . , Burvikova N . D . Pretsedentnyy tekst kak redutsirovannyy diskurs [Precedential text as a kind of reduced discourse] . Yazyk kak

tvorchestvo. K 70-letiyu V. P. Grigor'yeva: sborniknauchnykh trudov [Language as creativity. To the 70th anniversary of V. P. Grigoryev: compilation of research-based articles], Moscow, Institute of the Russian Language Russian Academy of Sciences Publ . , 1996, pp . 297-330 (in Russian) .

6 . Yatsko V. A. Simmetrichnoye referirovaniye: teoreticheskiye osnovy i metodika [Symmetrical rendering: theoretical bases and technique] . NTI,

2002, series 2, no . 5, pp . 18-27 (in Russian) .

7 . Blyumenau D . I . Informatsionnyy analiz/sintez dlya formirovaniya vtorichnogo potoka dokumentov [Informational analysis/synthesis for the

formation of the secondary influx of documents] . Saint-Petersburg, Professiya Publ . , 2002 . 235p . (in Russian) .

8 . Razinkina N . M . Funktsional'naya stilistika (na materiale angliyskogo i russkogo yazykov): ucheb. posobiye [Functional stylistics (on the material

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

of the English and the Russian languages): textbook] . Moscow, Vysshaya shkola Publ . , 2004. 271p . (in Russian) .

9 . Ercan G . , Cicekli . I . Using lexical chains for keyword extraction . Information Processing & Management, 2007, vol . 43 (6), pp . 1705-1714. URL:

https://www.sciencedirect.com/science/article/abs/pii/S0306457307000398 (accessed 19 August 2018) .

10 . Shekhtman N .A . Sistemnost' leksiki i semantika slova: uchebnoye posobiye k spetskursu [The systematic issue of the vocabulary and semantics

of the word: training manual] . Kuybyshev, Kuybyshev Publ . , 1988. 84 p . (in Russian) .

II. Church A. Vvedeniye v matematicheskuyu logiku [Introduction to the mathematical logics] . Moscow, Librokom Publ . , 2009 . Vol . 1. 482 p . (in Russian)

12 . Gusserl' E . Logicheskiye issledovaniya [Logics Research] . Saint-Petersburg, Akademicheskiy proekt Publ . , 2011. Vol . 2 . 576 p . (in Russian) .

13 . Longman Dictionary of Contemporary English. Harlow, Pearson Education Ltd . , 2005. 1950 p .

Moskvitina T. N., South Ural State Humanitarian Pedagogical University (pr. Lenina, 69, Chelyabinsk, Russian Federation, 454080). E-mail: moskvitinatn@cspu.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.