Научная статья на тему 'КОРПУСНЫЕ ТЕХНОЛОГИИ В ЛИНГВИСТИЧЕСКИХ ИССЛЕДОВАНИЯХ'

КОРПУСНЫЕ ТЕХНОЛОГИИ В ЛИНГВИСТИЧЕСКИХ ИССЛЕДОВАНИЯХ Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
1360
267
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
корпусная лингвистика / корпус / корпусы / корпусные технологии / корпусный менеджер / конкорданс / corpus linguistics / corpus / corpora / corpus technologies / corpus manager / concordance

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Палийчук Дарья Александровна

данной статье рассматриваются корпусные технологии как один из актуальных инструментов в современных исследованиях. Была отмечена важная роль корпусной лингвистики, стремительно развивающееся направление лингвистики, которое предоставляет широкий спектр возможностей для решения разного рода задач. Данное преимущество корпусной лингвистики в первую очередь связанно с особо быстрым развитием компьютерных технологий. Выделены ключевые понятия и термины корпусной лингвистики: корпус, конкорданс, корпусный менеджер и конкордансер. Термин «корпус» был отмечен в широком смысле как массив текстов, а также в узком смысле как собрание текстов, сопровожденное разметкой. Выделены основные черты корпуса: наличие прагматической ориентации, машиночитаемый формат, репрезентативность как результат процедуры отбора, наличие металингвистической информации. Конкорданс определен как результат поиска данных в корпусе, список всех употреблений данного слова в контексте со ссылками на источник. Рассмотрены лингвистические поисковые системы корпусный менеджер и конкордансер, а также были определены их функционал, отличия, задачи, для решения которых они используются. Проведен обзор работ, в которых исследователи различных областей знания занимались решением разного рода задач посредством применения корпусных менеджеров и конкордансеров: извлечение терминологии; изучение социально-политических явлений на основе частоты поведения лексических единиц; компьютерная визуализация языковой картины мира; обучение иностранным языкам. В рассмотренных работах многими учеными сделан вывод о высокой эффективности и удобстве современных корпусных технологий и отмечают их значительный вклад в прикладные науки и гуманитарные области знания.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CORPUS TECHNOLOGIES IN LINGUISTIC RESEARCH

This article deals with corpus technologies as one of the relevant tools in modern research. The important role of corpus linguistics, a rapidly developing area of linguistics, which provides a wide range of opportunities for solving various kinds of problems, was noted. This advantage of corpus linguistics is primarily associated with the rapid development of computer technology. The key concepts and terms of corpus linguistics are highlighted: corpus, concordance, corpus manager and concordancer. The term «corpus» has been noted in a broad sense as a collection of texts, and also in a narrow sense as a collection of texts accompanied by markup. The main features of the corpus were highlighted: the presence of a pragmatic orientation, a machine-readable format, representativeness as a result of the selection procedure, the presence of metalinguistic information. A concordance is defined as the result of a search for data in a corpus, a list of all occurrences of a given word in context, with references to the source. The linguistic search systems corpus manager and concordancer were considered, and their functionality, differences, tasks for which they were used were determined. A review of works in which researchers from various fields of knowledge were engaged in solving various kinds of problems through the use of corpus managers and concordancers was carried out: extraction of terminology; study of socio-political phenomena on the basis of the frequency of behavior of lexical units; computer visualization of the linguistic worldview; teaching foreign languages. In the reviewed works, many scientists concluded that modern corpus technologies are highly efficient and convenient, and note their significant contribution to applied sciences and the humanities.

Текст научной работы на тему «КОРПУСНЫЕ ТЕХНОЛОГИИ В ЛИНГВИСТИЧЕСКИХ ИССЛЕДОВАНИЯХ»

Гуманитарные исследования. История и филология. 2022. № 6. С. 72-79. Humanitarian Studies. History and Philology. 2022. No. 6. P. 72-79.

Научная статья УДК 811

doi: 10.24412/2713-0231- 2022-6-72-79

КОРПУСНЫЕ ТЕХНОЛОГИИ В ЛИНГВИСТИЧЕСКИХ ИССЛЕДОВАНИЯХ

Дарья Александровна Палийчук

Уральский федеральный университет имени первого Президента России Б.Н. Ельцина, Екатеринбург, Россия, dasha.paliichuck@yandex.ru.

Аннотация. В данной статье рассматриваются корпусные технологии как один из актуальных инструментов в современных исследованиях. Была отмечена важная роль корпусной лингвистики, стремительно развивающееся направление лингвистики, которое предоставляет широкий спектр возможностей для решения разного рода задач. Данное преимущество корпусной лингвистики в первую очередь связанно с особо быстрым развитием компьютерных технологий. Выделены ключевые понятия и термины корпусной лингвистики: корпус, конкорданс, корпусный менеджер и конкордансер. Термин «корпус» был отмечен в широком смысле как массив текстов, а также в узком смысле как собрание текстов, сопровожденное разметкой. Выделены основные черты корпуса: наличие прагматической ориентации, машиночитаемый формат, репрезентативность как результат процедуры отбора, наличие металингвистической информации. Конкорданс определен как результат поиска данных в корпусе, список всех употреблений данного слова в контексте со ссылками на источник. Рассмотрены лингвистические поисковые системы корпусный менеджер и конкордансер, а также были определены их функционал, отличия, задачи, для решения которых они используются. Проведен обзор работ, в которых исследователи различных областей знания занимались решением разного рода задач посредством применения корпусных менеджеров и конкордансеров: извлечение терминологии; изучение социально-политических явлений на основе частоты поведения лексических единиц; компьютерная визуализация языковой картины мира; обучение иностранным языкам. В рассмотренных работах многими учеными сделан вывод о высокой эффективности и удобстве современных корпусных технологий и отмечают их значительный вклад в прикладные науки и гуманитарные области знания.

Ключевые слова: корпусная лингвистика, корпус, корпусы, корпусные технологии, корпусный менеджер, конкорданс.

Для цитирования: Палийчук Д.А. Корпусные технологии в лингвистических исследованиях // Гуманитарные исследования. История и филология. 2022. № 6. С. 72-79. https://doi.org/10.24412/2713-0231- 2022-6-72-79

Original article

CORPUS TECHNOLOGIES IN LINGUISTIC RESEARCH Darya A. Palytchuk

University named after the first President of Russia B.N. Yeltsin, Ekaterinburg, Russia, dasha.paliichuck@yandex.ru.

Abstract. This article deals with corpus technologies as one of the relevant tools in modern research. The important role of corpus linguistics, a rapidly developing area of linguistics, which provides a wide range of opportunities for solving various kinds of problems, was noted. This advantage of corpus linguistics

© Палийчук Д.А., 2022

is primarily associated with the rapid development of computer technology. The key concepts and terms of corpus linguistics are highlighted: corpus, concordance, corpus manager and concordancer. The term «corpus» has been noted in a broad sense as a collection of texts, and also in a narrow sense as a collection of texts accompanied by markup. The main features of the corpus were highlighted: the presence of a pragmatic orientation, a machine-readable format, representativeness as a result of the selection procedure, the presence of metalinguistic information. A concordance is defined as the result of a search for data in a corpus, a list of all occurrences of a given word in context, with references to the source. The linguistic search systems corpus manager and concordancer were considered, and their functionality, differences, tasks for which they were used were determined. A review of works in which researchers from various fields of knowledge were engaged in solving various kinds of problems through the use of corpus managers and concordancers was carried out: extraction of terminology; study of socio-political phenomena on the basis of the frequency of behavior of lexical units; computer visualization of the linguistic worldview; teaching foreign languages. In the reviewed works, many scientists concluded that modern corpus technologies are highly efficient and convenient, and note their significant contribution to applied sciences and the humanities.

Keywords: corpus linguistics, corpus, corpora, corpus technologies, corpus manager, concordance.

For citation: Palytchuk D.A. Corpus technologies in linguistic research. Humanitarian Studies. History and Philology. 2022;6:72-79. (In Russ.). https://doi.org/10.24412/2713-0231- 2022-6-72-79

Введение

Современный этап развития лингвистической науки характеризуется активным внедрением и использованием компьютерных технологий. Применение современной компьютерной техники и сети интернет позволяет производить анализ большого объема языковых данных, доступного в электронном виде. Так, корпусная лингвистика (раздел компьютерной лингвистики, занимающийся разработкой общих принципов построения, разметки и использования огромных массивов текстов, лингвистических корпусов, на основе самых разнообразных компьютерных технологий [Захаров, Богданова 2013: 5]) считается одним из актуальных и стремительно развивающихся направлений современной лингвистики, а инструментарий в виде корпусных технологий приобретает большую значимость в лингвистических исследованиях для решения различных задач.

Основная часть

Центральным и ключевым понятием в корпусной лингвистике является понятие корпуса. Создатели первого лингвистического корпуса текстов на машинном носителе («Брауновский корпус», 1963 г.) У. Френсис и Г. Кучера использовали понятие «корпус» в значении совокупность текстов, считающаяся представительной для данного языка, диалекта или другого подмножества языка, предназначенная для лингвистического анализа [Francis, Kucera 1964]. В учебнике Э. Финегана приведено следующее определение корпуса: это репрезентативное собрание текстов, обычно в машиночитаемом формате, включающее информацию о ситуации, в которой текст был произведен, такую как информация о говорящем, авторе, адресате или аудитории [Finegan 2004: 536]. Согласно многим электронным ресурсам, корпусы - это большие и структурированные наборы или коллекции текстов, которые используются для статистического анализа и проверки гипотез, проверки случаев встречаемости или обоснования языковых правил по определенным областям [Захаров, Богданова 2013: 5]. Т. МакЭнери и Э. Вилсон предлагают следующее определение: корпус - собрание языковых фрагментов, отобранных в соответствии с четкими языковыми критериями для использования в качестве модели языка [McEnery, Wilson 2001: 29]

Также существует определение корпуса в широком смысле - собрание текстов, существующих на некотором языке в электронной форме. Однако, корпусные лингвисты отмечают, что данное определение обозначает понятие «протокорпус» или же «электронная библиотека» [Плунгян 2009]. Действительно, для пользователей корпусов на первый план выдвигается не содержание текстов, а их метатекстовая информация и примеры употребления определенных языковых элементов и конструкций. Таким образом, корпус в узком смысле -собрание текстов в электронном виде, сопровожденное разметкой. На основании

вышеуказанных определений можно выделить общие черты корпуса текстов: цель (или прагматическая ориентация), машиночитаемый (электронный) формат, репрезентативность как результат особой процедуры отбора, наличие металингвистической информации. В рамках лингвистики наиболее существенным является определение лингвистического (языкового) корпуса текстов - большой, представленный в машиночитаемом формате, унифицированный, структурированный, размеченный, филологически компетентный массив языковых данных, предназначенный для решения конкретных лингвистических или прикладных задач [Захаров, Богданова 2013: 5]. Вслед за В.П. Захаровым, мы придерживаемся именно этого определения.

Развитие компьютерных технологий поспособствовало созданию разных типов корпусов текстов, которые могут удовлетворить запросы исследователей для различных целей. Таким образом, на данный момент, существуют многоцелевые, специализированные, письменные, устные, смешанные, одноязычные, многоязычные, параллельные, литературные, диалектные, терминологические, разговорные, фольклорные, драматургические корпусы и т.п. Необходимо добавить, что современные корпусы постоянно пополняются и обновляются, а их сбор и разметка находятся на другом уровне. Ранее вышеуказанные операции производились на основе разрабатываемых лингвистами и затем программируемых правил. Современный этап развития технологий и систем обработки текстов предоставляет возможность собирать и обрабатывать данные для корпусов на основе статистического принципа: посредством сравнения и анализа текстовых фрагментов в сети Интернет специальными поисковыми программами и подбора наилучших соответствий.

Первоначально с помощью корпусов проводились исследования, ограниченные подсчетом частот встречаемости различных языковых единиц. Так, посредством корпусов появилась возможность обнаружить слова, которые регулярно встречаются вместе, и определить их как устойчивые словосочетания. В лексикографических исследованиях можно установить определенные семантические признаки отдельной языковой единицы, наблюдая её окружение в корпусе. Со временем спектр исследовательских задач расширился. Лингвисты-теоретики с помощью компьютерных корпусов проверяют гипотезы и находят доказательства теорий. Прикладные лингвисты (преподаватели, переводчики и т. д.) обращаются к корпусу при обучении языкам, для создания учебников и пособий, и решения своих профессиональных задач. Компьютерные лингвисты, в свою очередь, пытаются выявить и использовать статистические и лингвистические закономерности текстов для построения компьютерных моделей языка. Литературоведы и редакторы на материале компьютерных корпусов получают ответы на интересующие их вопросы. Историки и социологи могут изучать свои объекты через язык, на основании таких параметров текстов, как период, автор или жанр. Литературоведы используют корпусы для стилеметрических исследований [Захаров, Богданова 2013: 81]. Также корпусы активно используются в сферах разработки автоматизированных систем таких как машинный перевод, информационный поиск и распознавание речи. Понятия конкорданс и корпус-менеджер (или корпусный менеджер) неразрывно связаны с понятиями корпусной лингвистики и лингвистического корпуса.

Поиск данных в корпусе текстов позволяет по любому слову построить конкорданс -список всех употреблений данного слова в контексте со ссылками на источник. Ещё в начале 1980-х гг. А.С. Герд определил конкорданс как упорядоченный список словоформ (или слов) с указанием всех вхождений того или иного слова в заданный массив текстов, при этом для каждой словоформы приведен контекст, иллюстрирующий данное словоупотребление [Герд 1981: 73]. В.П. Захаров дает следующее определение конкорданса - список контекстов, где искомая единица представлена в её лексическом окружении и характеризуется набором статистических данных [Захаров 2005: 11].

Среди лингвистических задач, для решения которых используются конкордансы, выделяют: сравнение различных использований одного слова; анализ ключевых слов; анализ частотности слов и словосочетаний; поиск и исследование фраз и идиом; поиск перевода, например, терминологии; создание списков слов (что используется при публикации)

[Архипов 2010]. Работа в корпусе проводится с помощью корпусного менеджера (корпус-менеджера) - специализированной поисковой системы, включающей программные средства для поиска данных в корпусе, получения статистической информации и предоставления результатов пользователю в удобной форме [Захаров, Богданова 2013: 50]. Стоит добавить, что при использовании веб-пространства в качестве корпуса текстов роль корпусных менеджеров могут выполнять поисковые системы, в основном это глобальные информационные поисковые системы вербального типа. Применение корпус-менеджеров предоставляет пользователям следующие возможности, связанные с получением из корпуса необходимой информации: поиск конкретных словоформ; поиск словоформ по леммам; поиск группы словоформ в виде разрывной или неразрывной синтагмы; поиск словоформ по набору морфологических признаков; отображение информации о происхождении, типе текста и т. п.; вывод результатов поиска с указанием контекста заданной длины; получение различных лексико-грамматических статистических данных; сохранение отобранных строк конкорданса в отдельном файле на компьютере пользователя и др. [Захаров 2005: 10]. Наиболее известными корпусными менеджерами являются AntConc, Araneum, DDC, CQP, UAM, Manatee/Bonito, SARA, SketchEngine, WordSmith.

Корпусные менеджеры также называют конкордансерами, поскольку обычно результаты поиска отображены в виде конкорданса. Однако, есть некоторые различия между корпус-менеджерами и конкордансерами. Конкордансеры - программы составления конкордансов по тому или иному корпусу текстов, которые позволяют получать частоту некоторой языковой единицы, список контекстов, а также сортировать контексты по ключевому слову (в исходной форме) и по ближайшему контексту. В свою очередь, корпусные менеджеры способны строить полные конкордансы, включающие в себя не только слова, но и другие элементы корпуса. Корпус-менеджеры дают возможность получить из корпуса такие параметры как лемма и морфологические характеристики слова; позиция слова в предложении и в структуре размеченного текста (HTML, XML); библиографические и типологические признаки документа, из которого выбран контекст (автор, название, источник, год издания, тип текста и т. д.); статистические данные и т.п. На сегодняшний день корпусные технологии активно используются многими исследователями для достижения целей в различных научных областях [Богоявленская 2016; Богоявленская, Палийчук 2022; Гацук 2021; Глазырина 2012; Долгих 2018; Захаров, Масевич 2016; Захаров, Чжан 2020; Кротова 2019; Мальцева 2011; Нагель 2008; Новикова 2020; Осипова, Тарнаева 2016; Хохлова 2012; Чернякова 2011 и др.].

Так, М.В, Хохлова в своей работе по выявлению терминов на базе корпуса специальных текстов (по корпусной лингвистике) отмечает корпус-менеджер SketchEngine. Автор выделяет особенность данной системы, которая заключается в наличии средств, способных реализовать методику дистрибутивно-статистического анализа (тезаурус, кластеризация и дифференциация). Таким образом, исследователь делает вывод, что использование корпуса и инструментов системы Sketch Engine, обладающей рядом уникальных инструментов, позволяет выявлять в автоматизированном режиме синтагматические и парадигматические связи и создавать более адекватное наполнение тезауруса и терминосистемы [Хохлова 2012]. A.A. Новикова также занимается вопросом извлечения терминологии (на базе англоязычного корпуса технических текстов предметной области «Водоснабжение»). Исследователь сравнивает популярные корпусные инструменты обработки и извлечения лингвистической информации TermoStat и SketchEngine. Обе программы позволяют получить ранжированные списки терминов-кандидатов для дальнейшей оценки экспертом определенной предметной области. Отмечаются следующие отличия между SketchEngine и TermoStat: данные корпусные программы работают с разным количеством языков (TermoStat работает с 5 языками, а SketchEngine - более, чем с 85 языками); различные статистические меры для извлечения терминов; формат данных (Sketch Engine работает с файлами разных форматов (например, .doc, .docx, .htm, .html, .tei, .tmx, .txt, .vert, .xml, .pdf, .xls, .xlsx, .tmx, .xlf/.xliff, .ods, .zip, .tar.gz), TermoStat - только с 2 форматами .txt и

.rtf,). По результатам исследования выяснилось, что обе программы являются хорошими инструментами для извлечения терминов на базе корпуса специальных текстов, в основном благодаря использованию гибридных методов (комбинации статистических и лингвистических методов), однако были обнаружены различия по показателям точности и полноты. TermoStat выделяет термины с большей точностью (85 %) в отличие от SketchEngine (71 %).

В своей работе З.Б. Долгих демонстрирует ряд преимуществ корпус-менеджера SketchEngine на примере анализа градуирующих средств португальского языка. Исследователь отмечает уникальную черту данной программы, заключающуюся в выводе списков коллокаций по отельным синтаксическим моделям. Корпусный менеджер SketchEngine позволяет создавать частотный словарь, а также группирует лексические единицы в лексико-семантические поля с внутренней кластеризацией и указанием силы связи между лексемами. Отмечается, что результат в виде данных полей визуализируется в формате модели, где слова, различные по цвету и размеру, сгруппированы и изображены вместе. В то же время автор подчеркивает необходимость в диагностировании состояния развития корпусов на конкретный, ограниченный во времени, период, поскольку в настоящее время данные регулярно обновляются, а текстовая информация в корпусе может устареть. Исследования посредством корпусных технологий не ограничиваются исключительно сферой лингвистики. В.П. Захаров и А.Ц. Масевич изучают социально-политические явления на основе частотного поведения лексических единиц, используя Google Books Ngram Viewer (основной инструмент), Национальный корпус русского языка (НКРЯ), Новый частотный словарь русской лексики (НЧСРЛ), а также Das Digitale Wörterbuch der deutschen Sprache (DWDS). В своей работе ученые проводят диахроническое исследование лексических единиц русского языка различных категорий (события или явления; лица или персоны; социально-политические системы, режимы; произведения (артефакты), политические документы).

На примере выражений «красный террор» и «белый террор» исследователи отмечают следующую динамику их частотности: до середины 1980-х гг. словосочетание «красный террор» в текстах встречается достаточно редко, затем наблюдается резкий скачок употреблений; выражение «белый террор» в свою очередь в 1930-е гг. обладало пиковым показателем частотности, который впоследствии постепенно снижался. Исследователи связывают данную динамику со значением понятий «красный террор» и «белый террор» в разных идеологических системах.

Авторы выделяют культурометрию (Culturomics) как активно развивающееся направление, которое выведет гуманитарную область на новый уровень посредством внедрения точных наук и новых методов. Культурометрия - исследование культуры человечества, направлений её развития во времени посредством количественного анализа слов и словосочетаний в очень больших корпусах оцифрованных текстов [Захаров, Масевич 2016: 25].

В своем исследовании В.П. Захаров и П. Чжан занимаются вопросом компьютерной визуализации русской языковой картины мира на примере трёх концептов: «империя», «власть» и «государство». Идентификаторы вышеуказанных концептов были извлечены на основе корпуса словарных статей лингвистических и энциклопедических словарей. В данной работе был описан такой способ визуализации семантических полей как облако тегов. Авторы отмечают облако тегов как один из важных, популярных и удобных способов компьютерной визуализации, который показывает слова, наиболее близкие к ключевому слову из всего набора лексических единиц определенного семантического поля. Данный способ был реализован посредством системы SketchEngine. Построенные с помощью SketchEngine диаграммы наглядно показывают парадигматические связи разных лексических единиц семантического поля, отражающих указанные концепты.

В настоящее время использование корпусных технологий в области преподавания иностранных языков считается стремительно развивающимся направлением, которым занимаются многие специалисты [Глазырина 2012; Мальцева 2011; Нагель 2008; Чернякова 2011 и др.].

В данных работах отмечается особая роль корпусных менеджеров и конкордансеров в обучении иностранным языкам. Так, данные поисковые системы предоставляют обучающимся возможность самостоятельно осуществить лингвистический анализ, оценить употребление различных лексических единиц непосредственно носителями языка, получить информацию о типе и происхождении текста. Также корпусные технологии позволяют отслеживать преобразования в языке за счет регулярного обновления корпусов. Для преподавателей применение данных систем открывает возможность составления лексико-грамматических заданий и тестов.

Заключение

Таким образом, корпусные технологии являются важным инструментом для решения различных задач в современных исследованиях, что связано с активным и стремительным развитием компьютерных технологий и постоянным обновлением данных. Следует отметить значительный вклад использования корпусных технологий в прикладные науки и гуманитарные области знания посредством внедрения точных методов. После проведенного обзора исследований различной направленности необходимо выделить корпусный менеджер SketchEngine как один из актуальных инструментов.

Список литературы

1. Архипов А.В. Конкорданс [Электронный ресурс] URL: http://www.lomonosov-fund.ru/enc/ru/encyclopedia:0127200 (дата обращения: 03.06.2022).

2. Богоявленская Ю.В. Объектно-ориентированный корпус в сопоставительных исследованиях // Политическая лингвистика: проблематика, методология, аспекты исследования и перспективы развития научного направления: материалы Международной научной конференции. 2016. С. 37-39.

3. Богоявленская Ю.В. Репрезентативность лингвистического корпуса: метод верификации достоверности полученных данных // Политическая лингвистика. 2016. № 4 (58). С. 163-166.

4. Богоявленская Ю.В., Палийчук Д.А. Меры ассоциации для установления силы семантико-синтагматической связи элементов словосочетания // Гуманитарные исследования. История и филология. 2022. № 5. С. 69-78.

5. Гацук Е.Ю. Sketch Engine как инструмент для выявления специальных номинаций (на примере англоязычных текстов предметной области «Языковая политика») // Язык и межкультурная коммуникация: современные векторы развития: сборник научных статей по материалам II Международной научно-практической конференции. Пинск: Полесский государственный университет, 2021. № 2. С. 89-96.

6. Герд А.С. Автоматизация в лексикографии и словари-конкордансы // Филологические науки. 1981. № 1. С. 72-78.

7. Глазырина А.И. Использование конкордансеров при обучении английскому языку для специальных целей // Педагогическое образование в России. 2012. № 1. С. 178-182.

8. Долгих З.Б. Обзор ряда корпусных возможностей в сфере лингвистических исследований (на примере анализа средств градуирования в португальском языке) // Вестник Московского государственного лингвистического университета. Гуманитарные науки. 2018. № 5 (795). С. 21-32.

9. Захаров В.П., Богданова С.Ю. Корпусная лингвистика: учебник для студентов направления «Лингвистика». 2-е изд., перераб. и доп., СПб.: СпбГУ. РИО. Филологический факультет, 2013. 148 с.

10. Захаров В.П. Корпусная лингвистика: Учебно-метод. пособие. СПб.: Изд-во «Санкт-Петербургский университет», 2005. 48 с.

11. Захаров В.П., Масевич А.Ц. Методы корпусной лингвистики в исторических и культурогических исследованиях // Сборник научных статей XIX Объединенной конференции «Интернет и современное общество». СПб.: Изд-во «Университет ИТМО», 2016. С. 24-43.

12. Захаров В.П., Чжан П. Компьютерная визуализация русской языковой картины мира // International Journal of Open Information Technologies. 2020. № 1. С. 58-63.

13. Кротова Е.Б. Sketch Engine для лингвистических исследований // Германистика сегодня. Материалы Международной научно-практической конференции. Казань: Изд-во «Казанский университет», 2019. С. 107-112.

14. Мальцева М.С. Корпусные технологии в методике преподавания иностранных языков // Социально-экономические явления и процессы. 2011. № 8. С. 214-219.

15. Нагель О.В. Корпусная лингвистика и ее использование в компьютеризированном языковом обучении // Язык и культура. 2008. № 4. С. 53-59.

16. Новикова А.А. Сравнение инструментов Sketch Engine и TermoStat для извлечения терминологии // International Journal of Open Information Technologies. 2020. № 11. С. 73-79.

17. Осипова Е.С., Тарнаева Л.П. Использование ресурсов корпусной лингвистики при подготовке переводчиков в сфере профессиональной коммуникации // Филологические науки. Вопросы теории и практики. 2016. № 9-1 (63). С. 205-209.

18. Плунгян В.А. Почему современная лингвистика должна быть лингвистикой корпусов [Электронный ресурс] // Лекция, прочитанная в рамках проекта «Публичные лекции Полит.ру». URL: http://polit.ru/article/2009/10/23/corpus/ (дата обращения: 01.06.2022).

19. Хохлова М.В. Лексико-синтаксические шаблоны как инструмент выявления специальной лексики предметной области [Электронный ресурс] // Статьи, публикуемые на сайте международной конференции Диалог-2012 URL: https://www.dialog-21.ru/media/1392/%D1%85%D0%BE%D1%85% D0%BB%D0%BE%D0%B2%D0%B0%D0%BC%D0%B2.pdf (дата обращения: 05.06.2022).

20. Чернякова Т.А. Использование лингвистического корпуса в обучении иностранному языку // Язык и культура. 2011. № 4 (16). С. 127-132.

21. Finegan E. LANGUAGE: its structure and use. N.Y.: Harcourt Brace College Publishers, 2004.

613 p.

22. Francis W.N. & Kucera H. Brown Corpus [Электронный ресурс]. 1964. URL: http://clu.uni.no/icame/brown/bcm.html#bc3 (дата обращения: 05.06.2022).

23. McEnery T. & Wilson A. Corpus Linguistics. Edinburgh: Edinburgh University Press, 2000. 235 p.

References

1. Arkhipov A.V. Konkordans [Concordance] (In russ.). Available at: http://www.lomonosov-fund.ru/enc/ru/encyclopedia:0127200 (accessed: 03.06.2022).

2. Bogoiavlenskaia Iu.V. Ob"ektno-orientirovannyi korpus v sopostavitel'nykh issledovaniiakh [Object-Oriented Corpus in Comparative Studies]. Politicheskaia lingvistika: problematika, metodologiia, aspekty issledovaniia i perspektivy razvitiia nauchnogo napravleniia: materialy Mezhdunarodnoi nauchnoi konferentsii. 2016, pp. 37-39. (In russ.).

3. Bogoiavlenskaia Iu.V. Reprezentativnost' lingvisticheskogo korpusa: metod verifikatsii dostovernosti poluchennykh dannykh [Representativeness of the Linguistic Corpus: a Method for Verifying the Reliability of the Obtained Data]. Politicheskaia lingvistika. 2016, no. 4 (58), pp. 163-166. (In russ.).

4. Bogoiavlenskaia Iu.V., Paliichuk D.A. Mery assotsiatsii dlia ustanovleniia sily semantiko-sintagmaticheskoi sviazi elementov slovosochetaniia [Association measures to establish the strength of the semantic-syntagmatic connection of the elements of the phrase]. Gumanitarnye issledovaniia. Istoriia i filologiia. 2022, no. 5, pp. 69-78. (In russ.).

5. Gatsuk E.Iu. Sketch Engine kak instrument dlia vyiavleniia spetsial'nykh nominatsii (na primere angloiazychnykh tekstov predmetnoi oblasti «Iazykovaia politika») [Sketch Engine as a tool for identifying special nominations (on the example of English-language texts in the subject area "Language Policy")]. Iazyk i mezhkul'turnaia kommunikatsiia: sovremennye vektory razvitiia: sbornik nauchnykh statei po materialam II Mezhdunarodnoi nauchno-prakticheskoi konferentsii. Pinsk, Polesskij gosudarstvennyj universitet, 2021, no. 2, pp. 89-96. (In russ.).

6. Gerd A.S. Avtomatizatsiia v leksikografii i slovari-konkordansy [Automation in lexicography and concordance dictionaries]. Filologicheskie nauki. 1981, no. 1, pp. 72-78. (In russ.).

7. Glazyrina A.I. Ispol'zovanie konkordanserov pri obuchenii angliiskomu iazyku dlia spetsial'nykh tselei [Using Concordancers in Teaching English for Special Purposes]. Pedagogicheskoe obrazovanie v Rossii. 2012, no. 1, pp. 178-182. (In russ.).

8. Dolgikh Z.B. Obzor riada korpusnykh vozmozhnostei v sfere lingvisticheskikh issledovanii (na primere analiza sredstv graduirovaniia v portugal'skom iazyke) [Review of a number of corpus possibilities in the field of linguistic research (on the example of the analysis of grading means in Portuguese)]. Vestnik Moskovskogo gosudarstvennogo lingvisticheskogo universiteta. Gumanitarnye nauki. 2018, no. 5 (795), pp. 21-32. (In russ.).

9. Zakharov V.P., Bogdanova S.Iu. Korpusnaia lingvistika: uchebnik dlia studentov napravleniia «Lingvistika» [Corpus linguistics: a textbook for students of the direction "Linguistics"]. 2nd edition, St. Petersburg, SpbGU. RIO. Filologicheskii fakul'tet, 2013, 148 p. (In russ.).

10. Zakharov V.P. Korpusnaia lingvistika [Corpus linguistics]. St. Petersburg, Izd-vo «Sankt-Peterburgskii universitet», 2005, 48 p. (In russ.).

11. Zakharov V.P., Masevich A.Ts. Metody korpusnoi lingvistiki v istoricheskikh i kul'turogicheskikh issledovaniiakh [Methods of corpus linguistics in historical and cultural studies]. Sbornik nauchnykh statei XIX Ob"edinennoi konferentsii «Internet i sovremennoe obshchestvo». St. Petersburg, Izd-vo «Universitet ITMO», 2016, pp. 24-43. (In russ.).

12. Zakharov V.P., Chzhan P. Komp'iuternaia vizualizatsiia russkoi iazykovoi kartiny mira [Computer visualization of the Russian language picture of the world]. International Journal of Open Information Technologies. 2020, no. 1, pp. 58-63. (In russ.).

13. Krotova E.B. Sketch Engine dlia lingvisticheskikh issledovanii [Sketch Engine for linguistic research]. Germanistika segodnia. Materialy Mezhdunarodnoi nauchno-prakticheskoi konferentsii. Kazan', Izd-vo «Kazanskii universitet», 2019, pp. 107-112. (In russ.).

14. Mal'tseva M.S. Korpusnye tekhnologii v metodike prepodavaniia inostrannykh iazykov [Corpus technologies in the methodology of teaching foreign languages]. Sotsial'no-ekonomicheskie iavleniia i protsessy. 2011, no. 8, pp. 214-219.

15. Nagel' O.V. Korpusnaia lingvistika i ee ispol'zovanie v komp'iuterizirovannom iazykovom obuchenii [Corpus linguistics and its use in computerized language teaching]. Iazyk i kul'tura. 2008, no. 4, pp. 53-59. (In russ.).

16. Novikova A.A. Sravnenie instrumentov Sketch Engine i TermoStat dlia izvlecheniia terminologii // International Journal of Open Information Technologies. 2020, no. 11, pp. 73-79. (In russ.).

17. Osipova E.S., Tarnaeva L.P. Ispol'zovanie resursov korpusnoi lingvistiki pri podgotovke perevodchikov v sfere professional'noi kommunikatsii [Comparison of Sketch Engine and TermoStat tools for terminology extraction]. Filologicheskie nauki. Voprosy teorii ipraktiki. 2016, no. 9-1 (63), pp. 205-209. (In russ.).

18. Plungian V.A. Pochemu sovremennaia lingvistika dolzhna byt' lingvistikoi korpusov [Why Modern Linguistics Should Be a Corpus Linguistics]. Lektsiia, prochitannaia v ramkakh proekta «Publichnye lektsii Polit.ru». (In russ.). Available at: http://polit.ru/article/2009/10/23/corpus/ (accessed: 01.06.2022).

19. Khokhlova M.V. Leksiko-sintaksicheskie shablony kak instrument vyiavleniia spetsial'noi leksiki predmetnoi oblasti. [Lexico-syntactic patterns as a tool for identifying special vocabulary of the subject area]. Stat'i, publikuemye na saite mezhdunarodnoi konferentsii Dialog-2012. (In russ.). Available at: https://www.dialog-

21.ru/media/1392/%D1%85%D0%BE%D1%85%D0%BB%D0%BE%D0%B2%D0%B0%D0%BC%D0%B 2.pdf (accessed: 05.06.2022).

20. Cherniakova T.A. Ispol'zovanie lingvisticheskogo korpusa v obuchenii inostrannomu iazyku [The use of the linguistic corpus in teaching a foreign language]. Iazyki kul'tura. 2011, no. 4 (16), pp. 127-132. (In russ.).

21. Finegan E. LANGUAGE: its structure and use. N.Y.: Harcourt Brace College Publishers, 2004. 613 p.

22. Francis W.N. & Kucera H. Brown Corpus [Электронный ресурс]. 1964. URL: http://clu.uni.no/icame/brown/bcm.html#bc3 (дата обращения: 05.06.2022).

23. McEnery T. & Wilson A. Corpus Linguistics. Edinburgh: Edinburgh University Press, 2000. 235 p.

Информация об авторе Д.А. Палийчук - ассистент кафедры лингвистики и профессиональной коммуникации на иностранных языках, Уральский федеральный университет имени первого Президента России Б.Н. Ельцина.

Information about the author D.A. Palytchuk - Assistant of the Department of Linguistics and Professional Communication in Foreign Languages, Ural Federal University named after the first President of Russia B.N. Yeltsin.

Статья поступила в редакцию 14.02.2022; одобрена после рецензирования 28.02.2022; принята к публикации 25.03.2022.

The article was submitted 14.02.2022; approved after reviewing 28.02.2022; accepted for publication 25.03.2022.

i Надоели баннеры? Вы всегда можете отключить рекламу.