Научная статья на тему 'ИССЛЕДОВАТЕЛЬСКИЙ КОРПУС ТЕКСТОВ В РАМКАХ ТЕМАТИЧЕСКОЙ СФЕРЫ «КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ»: ЖАНРОВЫЙ И ЛИНГВОКОГНИТИВНЫЙ АНАЛИЗ'

ИССЛЕДОВАТЕЛЬСКИЙ КОРПУС ТЕКСТОВ В РАМКАХ ТЕМАТИЧЕСКОЙ СФЕРЫ «КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ»: ЖАНРОВЫЙ И ЛИНГВОКОГНИТИВНЫЙ АНАЛИЗ Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
70
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОРПУС / ТЕМАТИЧЕСКИЙ БЛОК / ЖАНР / ТЕМАТИЧЕСКАЯ СФЕРА / ДИСКУРС

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Балашова Дарья Юрьевна

Статья посвящена анализу жанрового состава оригинального исследовательского корпуса текстов в рамках тематической сферы «Компьютерные технологии». Автор анализирует связь дискурса и жанра в языке и коммуникации, описывает развитие теории речевых жанров в современной лингвистике, а также изучает научно-технический текст с дискурсивных позиций. В исследуемом корпусе текстов объёмом на 143 037 словоупотреблений выделяются такие базовые тематические блоки, как «База данных / Database», «Технологии / Technologies» и «Патенты и инструкции / Patents & Instructions». Проведённый анализ текстов, принадлежащих тому или иному тематическому блоку, позволяет определить семантические и структурно-синтаксические характеристики последнего. Автор предпринял попытку описать языковые особенности текстов разных жанров, а также определить набор высокочастотных лексических единиц в выделенных тематических блоках. Таким образом, жанровый, статистический и семантико-когнитивный анализ электронного корпуса текстов даёт возможность получить данные об организации тематической сферы «Компьютерные технологии» в языке и современной коммуникации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Балашова Дарья Юрьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE RESEARCH TEXT CORPUS IN THE THEMATIC SPHERE “COMPUTER TECHNOLOGIES”: GENRE AND LINGUOCOGNITIVE ANALYSIS

The article is devoted to the analysis of the genre composition of the research text corpus within the framework of the thematic sphere “Computer technologies”. The author analyzes the correlation of discourse and genre in language and communication, describes the development of the speech genres’ theory in modern linguistics as well as studies scientific and technical texts from discourse theory perspective. In 143 037 words research corpus under study there are such basic thematic domains as “Database”, “Technologies” and “Patents & Instructions”. The conducted analysis of the texts belonging to this or that thematic domain, allows to determine semantic, structural and syntactic characteristics of the latter. The author made an attempt to describe the linguistic features of the texts belonging to different genres as well as to determine a set of high-frequency lexical units in the above-mentioned thematic domains. So genre, statistic, semantic and cognitive analysis of electronic text corpus allows to represent the thematic sphere “Computer technologies” in language and modern communication.

Текст научной работы на тему «ИССЛЕДОВАТЕЛЬСКИЙ КОРПУС ТЕКСТОВ В РАМКАХ ТЕМАТИЧЕСКОЙ СФЕРЫ «КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ»: ЖАНРОВЫЙ И ЛИНГВОКОГНИТИВНЫЙ АНАЛИЗ»

Вестник Челябинского государственного университета.

2021. № 9 (455). Филологические науки. Вып. 126. С. 13—19.

УДК 811.1111+811.161.11 DOI 10.47475/1994-2796-2021-10902

ББК 81.2 Рус-3+81.2 Англ-3

ИССЛЕДОВАТЕЛЬСКИЙ КОРПУС ТЕКСТОВ В РАМКАХ ТЕМАТИЧЕСКОЙ СФЕРЫ «КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ»: ЖАНРОВЫЙ И ЛИНГВОКОГНИТИВНЫЙ АНАЛИЗ

Д. Ю. Балашова

Профессионально-педагогический колледж Саратовского государственного технического университета имени Гагарина Ю. А., Саратов, Россия

Статья посвящена анализу жанрового состава оригинального исследовательского корпуса текстов в рамках тематической сферы «Компьютерные технологии». Автор анализирует связь дискурса и жанра в языке и коммуникации, описывает развитие теории речевых жанров в современной лингвистике, а также изучает научно-технический текст с дискурсивных позиций. В исследуемом корпусе текстов объёмом на 143 037 словоупотреблений выделяются такие базовые тематические блоки, как «База данных /Database», «Технологии / Technologies» и «Патенты и инструкции /Patents & Instructions». Проведённый анализ текстов, принадлежащих тому или иному тематическому блоку, позволяет определить семантические и структурно-синтаксические характеристики последнего. Автор предпринял попытку описать языковые особенности текстов разных жанров, а также определить набор высокочастотных лексических единиц в выделенных тематических блоках. Таким образом, жанровый, статистический и семантико-когнитивный анализ электронного корпуса текстов даёт возможность получить данные об организации тематической сферы «Компьютерные технологии» в языке и современной коммуникации.

Ключевые слова: корпус, тематический блок, жанр, тематическая сфера, дискурс.

Введение

Изучение жанров является одной из ключевых проблем современной лингвистики. С появлением электронных корпусов исследователи получили возможность проводить масштабные жанровые исследования в рамках современной коммуникации. Актуальность данной работы обусловлена, таким образом, следующими факторами: во-первых, отсутствием целостного подхода к изучению лингвокультурной специфики, лексико-семантической и когнитивной организации крупных тематических сфер и областей, принадлежащих области современной коммуникации; во-вторых, необходимостью разработки новых подходов к корпусному анализу как самостоятельному направлению в ряду лингвистических дисциплин и создания комплексной методики лингвокогнитивного и жанрового моделирования тематических сфер; в-третьих, неуклонно возрастающим исследовательским интересом к возможностям электронного корпуса текста как в плане методики преподавания лингвистических дисциплин, так и в плане изучения языковых структур. В целом можно сделать вывод, что актуальность данной работы породило взаимодействие проблем общетеоретического и методологического характера.

Целью настоящего исследования является анализ жанрового состава исследовательского корпуса текстов, принадлежащих тематической сфере «Компьютерные технологии». Достижение поставленной цели требует решения следующих задач:

1) изучение теоретических проблем современной жанрологии и дискурсологии;

2) теоретическое исследование научно-технического текста как дискурсной единицы;

3) создание исследовательского корпуса текстов на 143 037 словоупотреблений в рамках тематической сферы «Компьютерные технологии»;

4) жанровый и лексико-семантический анализ корпусных текстов.

Гипотеза, положенная в основу исследования, состоит в том, что тематическая сфера «Компьютерные технологии», являясь значимым сегментом современной коммуникации, принадлежит научно-техническому дискурсу и может быть изучена на материале исследовательского электронного корпуса текстов с применением корпусных технологий.

Методами исследования являются такие виды лингвистического анализа, как семантический, контекстуальный, лексико-грамматический, а также автоматизированные приёмы статистической

обработки текста с помощью компьютерной программы конкорданса АпСопс.

Исследовательский корпус из 136 текстов был составлен методом выборки из различных источников сети Интернет. Жанровый и тематический анализ корпуса позволил разделить его на крупные тематические блоки. С помощью инструментария программы АпСопс были выделены ключевые слова в каждом тематическом блоке (программа загружает несколько десятков текстов одновременно, проводит их статистическую обработку и выделяет ключевые слова с указанием частоты их употреблений).

Проблему жанров речи одним из первых поставил М. М. Бахтин. Он считал «речевой жанр категорией, которая позволяет связывать социальную реальность с реальностью языковой» [1. С. 386]. М. М. Бахтин полагал, что речевые жанры — это «относительно устойчивые, композиционные и стилистические типы высказывания», «типовые модели построения речевого целого» [1. С. 340]. Термин «субжанр» был введён К. Ф. Седовым и обозначал жанровые формы, представляющие собой одноактовые высказывания. «Это минимальные единицы типологии речевых жанров, равные одному речевому акту и выступающие в виде тактик, основное предназначение которых менять сюжетные повороты в развитии интеракции. А речевые формы, которые объединяют в своем составе несколько жанров, получили название «гипержанров» [12. С. 35—37].

В 1960—70-е гг. приоритетными являлись исследования лингвопрагматического и социолингвистического характера [2], а в терминологическом аппарате лингвистики появляются понятия «дискурс» и «дискурс-анализ». Ю. Хабермас считается основоположником современной дискурсологии. Под дискурсом исследователь понимал речевую коммуникацию, ориентированную на «рациональное критическое рассмотрение норм и ценностей, а также правил социальной жизни» [8. С. 12]. С позиций французской лингвистической школы, ярким представителем которой считался Э. Бенвенист, дискурс — это «речь, присваиваемая говорящим, в противоположность повествованию, которое разворачивается без эксплицитного вмешательства субъекта повествования» [13. С. 17].

Научно-технический текст как структурная единица дискурса

Исследования в области научно-технического дискурса ведутся учеными сравнительно недавно.

А. В. Дуброва считает, что научно-технический дискурс — «это тип дискурса, используемый наукой для изложения и описания новых открытий, теорий, гипотез, учений, для анализа и представления технологий» [4. С. 115]. Минимальной структурной единицей научно-технического дискурса, на наш взгляд, является научный текст. Представляется возможным выделить такие особенности научно-технического текста, «как его информативность; логичность, то есть строгую последовательность и четкую связь между основной идеей и деталями; точность и объективность; ясность и понятность; аргументированность изложения» [6. С. 35—36]. Е. А. Мякишева считает, что научно-техническим текстам свойственна «насыщенность узкоспециальными и общенаучными терминами, в связи с их точностью и информативностью. Значительно развита специальная общетехническая лексика — слова и словосочетания, не являющиеся терминами, могут представлять собой всевозможные производные от терминов» [9. С. 14]. «Содержательно-смысловая структура научного текста является коммуникативно-прагматической по своей сути, то есть она представляет собой сложное единство, состоящее из двух типов смыслового содержания: коммуникативно-информационного и прагматического содержания текста» [7. С. 80]. А. А. Стрельцов считает, что «основной стилистической чертой научного текста является точное и четкое изображение материала при почти полном отсутствии тех выразительных элементов, которые придают речи эмоциональную насыщенность. Главный упор делается на логической, а не эмоционально-чувствительной стороне излагаемого. Эмоциональные языковые элементы не играют решающей роли, однако в ней присутствует элемент образности, и в целом экспрессивности» [11. С. 7].

Исследователи отмечают, что научно-технический текст — «это информативный текст. Он создается одним или несколькими авторами. Основной коммуникативной функцией научно-технического текста является описание предметов и явлений. Во всех видах научного текста преобладает когнитивная информация. Когнитивной или познавательной информацией называют объективные сведения о внешнем мире» [11. С. 6]. В целом отметим, что научно-технический дискурс — «это тип дискурса, используемый наукой и технологией для изложения и написания новых технологий. Имея основной целью передачу подобного типа информации, научно-технический

дискурс характеризуется как источник извлечения непосредственной полезной информации, лишаясь при этом поэтичности, образности изложения и какой-либо эмоциональности [4. С. 115]. Как правило, научно-технические тексты содержат языковые средства, которые используются в конкретной предметной области. Отметим, что научно-технический дискурс может включать в себя большое количество тематических сфер: компьютерные технологии, интернет, носители информации, технические устройства и проч.

Традиционная лингвистика чётко разграничивает понятия «тематическая группа» и «тематическое поле». Так, Н. М. Шанский считает, что в «тематическую группу лексики могут входить лексемы различных частей речи, которые объединены классификациями реалий, но не лексико-семан-тических связей» [15. С. 209]. Так, тематическая сфера «Компьютерные технологии» может содержать такие тематические группы, как «нейронные сети», «устройства», «программирование», «интернет» и др. Исследователь Ф. П. Филин полагает: «если заменить одну лексему в рамках тематической группы на другую лексему, то это не приведет к изменению лексического значения всей группы. Это говорит о том, что семантические связи отсутствуют между лексемами в таком объединении» [14. С. 231—232]. Длительное время считалось, что системных языковых связей в полях не существует, а понятия «тематическое поле» и «семантическое поле» идентичны [5. С. 67]. О. Б. Пылаева предлагает несколько иное понимание тематического поля и выделяет следующие его характеристики: 1) тематическая классификация характерна для имён существительных, в которых превалирует денотативное содержание; 2) тематическое поле относится к единой предметной области, причём особую роль играют экстралингвистические факторы; 3) члены единого тематического поля могут иметь разные семантические значения [10. С. 12—13].

Материал и метод исследования

Первый большой корпус данных на английском языке, состоявший из одного миллиона слов, начал составляться в Университетском колледже Лондона в 1960-е гг. Он назывался «Survey of English Usage», а руководил им Р. Кверк. В состав корпуса входило 200 устных и письменных текстов, каждый из которых содержал 5000 слов. Позднее Йэн Свартвик из Лундского университета создал электронную версию собранного ма-

териала, и она получила название "London-Lund Corpus of Spoken English" [13. С. 57].

Современные корпусные технологии позволяют изучать самые разнообразные жанры в структуре современной коммуникации, но, как справедливо указывают В. В. Дементьев и Н. Б. Степанова, «разработанной корпусной методики для решения речежанровых проблем лингвистики пока нет» [3. С. 57].

Исследуемая в данной статье тематическая сфера «Компьютерные технологии» входит в научно-технический дискурс. Нами был составлен исследовательский корпус, общий объём словоупотреблений которого, по данным статистики программы Word, составляет 143 037. С позиций современной корпусной лингвистики репрезентативность корпуса оценивается с содержательной и количественной точек зрения. В количественном аспекте значимо, прежде всего, количество словоупотреблений. Считается, что специализированные корпуса подъязыка (собранный нами корпус технических текстов принадлежит данному виду корпусов) должны содержать не менее 100 тысяч словоупотреблений.

Корпус, на материале которого проведено данное исследование, был собран методом выборки текстов из сети Интернет. В корпус входят статьи из технических онлайн-журналов: Journal of Artificial Intelligence Research, MDPI Technologies, International Journal of New Technology and Research (статьи авторов из Индии, Японии, Германии, Китая и Франции), Word Patent Information journal. Корпус разделен на такие крупные тематические блоки, как «База данных/Database», «Технологии/ Technologies» и «Патенты и инструкции / Patents & Instructions». Мы представим анализ лекси-ко-семантического состава и структурно-синтаксических частотных конструкций указанных тематических блоков, позволяющий выделить в семантической структуре лексических единиц дискурсивные индикаторы. С этой целью будет применена группа приёмов интерпретативного, контекстуального и структурно-семантического анализа в совокупности с методом количественного подсчёта и когнитивно-дискурсивным анализом.

Результаты исследования

Анализ показал, что блок Database составляют тексты по описанию баз данных и их схем. К ключевым словам указанного тематического блока, выборка которых получена с помощью

компьютерной программы управления корпусом AntConc1, относятся лексемы database (256), computer (215), software (132), relational (118), number (104), function (83), memory (80), process (218), select (127), command (126). В блоке Database преобладают имена существительные, так как он содержит большое количество схем баз данных, а глаголы часто объединены общей семой «обработка информации»: provide data, enroll data, save data. Данный блок состоит из 42 текстов, из которых 21 текст по базе данных, 13 текстов со схемами баз данных и 8 текстов, содержащих таблицы с пошаговыми вычислениями.

Для блока Database характерны:

1) усилительные конструкции (do perform);

2) глаголы будущего времени (will, will lead to update);

3) предложения с неопределенно-личным подлежащим типа one (one of the basic structure, one of the rule, it is critical to keep oneself updated);

4) безличные предложения с формальным подлежащим it (It would be helpful to use appropriate graphics; It is the best if you can format your cover letter so it fits on one page);

5) модальные глаголы (need, should, may);

6) наличие сложных составных союзов и союзных слов (both/and, either/or, moreover);

7) группа глаголов умственной деятельности, которые относятся к классу Stative verbs (to keep in mind, note);

8) преобладание глаголов в форме настоящего времени (need to add, describe sections);

9) предложения с порядковыми числительными, выполняющими функцию структурирования контекста (first enter your desire column, then simply cut the text from app whatever application, secondly write a cover letter, secondly find basic resources);

10) вводные конструкции в начале предложения с функцией логической организации текста (in addition, lately).

Блок Technologies представляет собой набор научных статей о новейших технологиях: примеры приложений для изучения компьютерных технологий, описание приложений для мобильных телефонов, а также технологий в области искус-

1 АшСопс — мультиплатформная компьютерная программа корпус-менеджер, предназначенная для обработки корпусов текстов. С помощью данной программы можно производить поиск и подсчет ключевых слов текста, анализировать частотность и контекст употребления словоформ, словосочетаний и морфем.

ственного интеллекта и др. Данный блок состоит из 69 текстов. К ключевым словам тематического блока Technologies относятся такие лексемы, как model (174), object (16), robot (199), email (137), software (132), select (127). В указанном тематическом блоке есть большое количество вводных слов, союзов и союзных слов, позволяющих сделать технические тексты более доступными, поскольку статьи принадлежат широкому кругу читателей. Так, например, высокочастотными являются такие союзы и союзные слова, как however (119), often (81), whether (71), before (60), which (919).

Анализ текстов, принадлежащих тематическому блоку Technologies, позволил выявить следующие его лексико-семантические и структурно-синтаксические характеристики:

1) наличие усилительной конструкции it is, а также её формы в прошедшем времени, часто употребляющейся с целью объяснения процесса использования (it is similar to the Record conversion methodology);

2) частое употребление глаголов в форме будущего времени (will, will have to, will apply);

3) использование предложений с неопределенно-личным подлежащим one;

4) наличие безличных предложений с формальным подлежащим (it is also provided, it seems, this also needs to...);

5) наличие сложного дополнения (complex object), а также большого числа модальных глаголов (need, should, may);

6) наличие составных союзов и союзных слов (as well as, not only... but, the former/the latter);

7) употребление глаголов, выражающих умственную деятельность и относящихся к классу Stative verbs (recognize, realize);

8) глаголы в настоящем времени появляются реже, чем в других блоках (provide database, save the file);

9) употребление в предложениях порядковых числительных first, second, third, fourth, fifth, описывающих каждый этап загрузок новых приложений, а также пошаговые инструкции эксплуатации приборов и техники (Firstly, use a readable font in a 10 or 12point size in your emails. Secondly, send job search-related emails from a professional email address. Finally, don't forget to include a Subject Line in your email);

10) вводные конструкции в начале предложения с логической функцией организации текста (therefore, meanwhile, from here, typically, in the above).

Блок Patents & Instructions включает 25 текстов, представляющих собой инструкции для написания программного кода (10 текстов), а также статьи о тех или иных патентах, изобретениях и патентоспособности в различных странах (15 текстов). Кроме того, данный тематический блок составляют различного рода инструкции: схемы программирования, пошаговые действия пользователя при использовании прибора или технологии. Тексты указанных поджанров имеют меньше вводных слов, более лаконичны и нередко напоминают четкие инструкции: First enter your desired column width in the appropriate box (again, I suggest no more than 50). Then simply cut the text from whatever application you are using and past it into the text field, or compose the text directly in the text field. If there is need to restart (like pasting the wrong text), click the ~Clear Text~ button to clear the text and start again.

Ключевыми словами данного блока являются лексемы information (180), language (159), application (114), company (85), available (87), approach (70), process (218), action (117), security (106), group (90). Союзов, предлогов и вводных слов в данном блоке значительно меньше, поскольку патенты и инструкции в основном состоят из простых односоставных предложений, тогда как авторские статьи содержат большое количество сложных предложений с союзными словами и вводными конструкциями.

Таким образом, тематический блок Patents & Instructions характеризуют следующие структурно-синтаксические особенности:

1) сложные предложения с придаточными условия, реализующие демонстрационную функцию использования новых технологий: If you forget to include one, your message probably isn't even going to get opened; If you do not have the contact person's name, simply address your email; If needed, an attorney would be happy to help, if you've decided that someone is infringing on your product and IP ;

2) глаголы в форме будущего времени (will, will use, will help);

3) безличные предложения с формальным подлежащим (it is... it is also provided, it seems, this also need to., it is better, there is/are). Например: It is in those countries that the claims need to be drafted carefully, it is more costly and time-consuming to acquire than a plant patent;

4) наличие сложного дополнения в предложениях;

5) модальные глаголы долженствования (need, should, may, must, can);

6) модальные глаголы категории вероятности (can, may, might);

7) союзы и союзные слова с функцией экспликации контекста (such as, for instance, further out, such that, in addition, in the case of);

8) употребление глаголов, выражающих умственную деятельность и принадлежащих классу Stative verbs (notice, understand, consider, mean);

9) низкая частота употребления глаголов в настоящем времени по сравнению с двумя другими тематическими блоками;

10) союзы и союзные слова, выраженные порядковыми числительными, с функцией организации контекста (firstly you need update, secondly refresh memory);

11) вводные конструкции в начале предложения с функцией структурирования текста (from here on out, for example, while);

12) наличие придаточных условия с союзом if

(if the variety carries benefits, do they justify the premium cost of the royalty and the new product development and marketing processes? If you need assistance with a software patent, Internet technology or computer device send me an e-mail).

Выводы

В заключение можно сделать вывод, что выделенные тематические блоки имеют принципиальные лексические и структурно-синтаксические отличия. Так, для блока Technologies характерны единицы robot, email, software, составляющие его лексическое ядро, а для блока Database — лексемы database и computer. Ядро блока Patents & Instructions состоит из лексем information, language, application. Тексты всех трёх блоков содержат большое количество модальных глаголов (can, may, might, need, should, must) и глаголов в форме будущего времени (shall, will, would). Однако в каждом блоке можно наблюдать характерные синтаксические конструкции. Например, в блоке Patents & Instructions (содержит 25 текстов) преобладают сложные предложения с придаточными условия. Подобный тип предложений структурирует инструкцию, обозначая поэтапные шаги пользователя. Для тематического блока Database (содержит 42 текста) характерны глагольные формы настоящих времен английского языка (Present Simple, Present Continuous, Present Perfect). Блоку Technologies свойственна усилительная конструкция it is / it was, употребляющаяся с целью

объяснения процесса использования того или иного технического продукта (из 69 текстов, составляющих данный блок, 54 текста содержат указанную конструкцию).

Составленный нами исследовательский корпус технических текстов в рамках тематической сферы «Компьютерные технологии» имеет не только сложную жанровую организацию (базы данных и схемы, научные статьи, описания приложений, различного рода инструкции и патен-

ты), но и специфичную лексико-семантическую и синтаксическую структуру. Проведённый анализ показывает, что каждый тематический блок обладает как общими, так и специфичными характеристиками. Таким образом, жанровый, статистический и семантико-когнитивный анализ электронного корпуса текстов даёт возможность получить данные об организации тематической сферы «Компьютерные технологии» в языке и современной коммуникации.

Список литературы

1. Бахтин М. М. Литературно-критические статьи. М.: Художественная литература, 1986. 541 с.

2. Гаспаров М. Л. Избранные статьи. М.: НЛО, 1995. 45 с.

3. Дементьев В. В., Степанова Н. Б. Корпусные методы в исследовании речевых жанров: проблема ключевых фраз // Вестник РУДН. Серия: Лингвистика. 2016. Т. 20. № 3. С. 57—76.

4. Дуброва А. В. Научно-технический дискурс и перевод (на материале английского и испанского языков) // Язык и дискурс: лингвистические, методические и социально-гуманитарные исследования. М.: МГПУ, 2017. С. 114—123.

5. Караулов Ю. Н. Структура лексико-семантического поля // Филологические науки. 1972. № 1. С. 57—68.

6. Крапивкина О. А., Мусохранова А. А. Лингво-прагматические аспекты перевода научно-технических текстов // Гуманитарные научные исследования. 2014. № 8. С. 34—37.

7. Крижановская Е. М. О стереотипности компонентов коммуникативно-прагматической структуры научного текста // Текст: стереотип и творчество. Пермь, 1998. С. 77—84.

8. Макаров М. Л. Основы теории дискурса. М.: Гнозис, 2003. 275 с.

9. Мякишева Е. А. Стилистические особенности научно-технического текста // Гуманитарные научные исследования. 2018. № 5. URL: https://human.snauka.ru/2018/05/25006 (дата обращения 12.04.2021).

10. Пылаева О. Б. Лакунарность лексико-семантического поля «Природа» на материале русского и эвенкийского языков: автореф. дис. ... канд. филол. наук. — Кемерово, 2002. 21 с.

11. Стрельцов А. А. Научно-технические тексты: от понимания к переводу. Ростов-на-Дону: Феникс, 2012. 398 с.

12. Седов К. Ф. Жанр и коммуникативная компетенция // Хорошая речь. Саратов: Изд-во Саратовского ун-та, 2001. С. 35—37.

13. Толстова Т. В. Жанр и корпус: современные подходы к изучению и преподаванию языка. Самара: Изд-во Самарского ун-та, 2018. 207 с.

14. Филин Ф. П. Очерки по истории языкознания. М.: Наука, 1982. 336 с.

15. Шанский Н. М. Лексикология современного русского языка. 4-е изд., доп. М.: Либроком, 2009. 305 с.

Сведения об авторе

Балашова Дарья Юрьевна — преподаватель английского языка Профессионально-педагогического колледжа Саратовского государственного технического университета имени Гагарина Ю. А., Саратов, Россия, ORCID: 0000-0002-1129-7009. balashovadarya@yandex.ru

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Bulletin of Chelyabinsk State University.

2021. No. 9 (455). Philology Sciences. Iss. 126. Pp. 13—19.

THE RESEARCH TEXT CORPUS IN THE THEMATIC SPHERE "COMPUTER TECHNOLOGIES": GENRE AND LINGUOCOGNITIVE ANALYSIS

D. Yu. Balashova

Vocational Pedagogical College of the Saratov State Technical University named after Yu. A. Gagarin, Saratov, Russia. balashovadarya@yandex.ru

The article is devoted to the analysis of the genre composition of the research text corpus within the framework of the thematic sphere "Computer technologies". The author analyzes the correlation of discourse and genre in language and communication, describes the development of the speech genres' theory in modern linguistics as well as studies scientific and technical texts from discourse theory perspective. In 143 037 words research corpus under study there are such basic thematic domains as "Database", "Technologies" and "Patents & Instructions". The conducted analysis of the texts belonging to this or that thematic domain, allows to determine semantic, structural and syntactic characteristics of the latter. The author made an attempt to describe the linguistic features of the texts belonging to different genres as well as to determine a set of high-frequency lexical units in the above-mentioned thematic domains. So genre, statistic, semantic and cognitive analysis of electronic text corpus allows to represent the thematic sphere "Computer technologies" in language and modern communication.

Keywords: corpus, thematic domain, genre, thematic sphere, discourse.

References

1. Bakhtin M. M. (1986) Literaturno-kriticheskiye stat'ji [Literary critical articles]. Moscow, Khudozhest-vennaya literatura. 541 p. [in Russ.].

2. Gasparov M. L. (1995) Izbrannye stat'ji [Selected articles]. Moscow, NLO. 45 p. [in Russ.].

3. Dementyev V. V., Stepanova N. B. (2016) VestnikRUDN. Serija: Lingüistica, vol. 20, no. 3, pp. 57—76 [in Russ.].

4. Dubrova A. V. (2017) Yazyk i diskurs: linguisticheskiye, metodicheskiye i social'no-gumanitarnye issle-dovaniya, pp. 114—123 [in Russ.].

5. Karaulov Yu. N. (1972) Philologicheskie nauki, no. 1, pp. 57—68 [in Russ.].

6. Krapivkina O. A., Mysokhranova A. A. (2014) Gumanitarnye nauchnye issledovaniya, no. 8, pp. 34—37 [in Russ.].

7. Krizhanovskaya E. M. (1998) Text: stereotip i tvorchestvo, pp. 77—84 [in Russ.].

8. Makarov M. L. (2003) Osnovy teorii diskursa [The foundations of discourse theory]. Moscow, Gnozis. 275 p. [in Russ.].

9. Myakicheva E. A. (2018) Gumanitarnye nauchnye issledovaniya, no. 5, available at https://human.snauka. ru/2018/05/25006 (accessed 12.04.2021) [in Russ.].

10. Pylaeva O. B. (2002) Lakunarnost' leksiko-semanticheskogo polya «Priroda» na materiale russkogo i evenkiyskogo yazykov [Lacunarity of the lexical-semantic field "Nature" on the material of the Russian and Evenk languages. Thesis]. Kemerovo. 21 p. [in Russ.].

11. Strel'tsov A. A. (2012) Nauchno-tekhnicheskiye teksty: ot ponimaniya k perevodu [Scientific and technical texts: from understanding to translation]. Rostov n/D, Feniks. 398 p. [in Russ.].

12. Sedov K. F. (2001) Khoroshaya rech. Saratov, Izd-vo Saratovskogo un-ta. Pp. 35—37 [in Russ.].

13. Tolstova T. V. (2018) Zhanr i korpus: sovremennye podkhody k izucheniyu i prepodavaniyu yazyka [Genre and corpus: the modern approaches to study and teaching language]. Samara, Izd-vo Samarskogo un-ta. 207 p. [in Russ.].

14. Philin F. P. (1982) Ocherki po isttorii yazykoznaniya [The essays on linguistics' history]. Moscow, Nau-ka. 336 p. [in Russ.].

15. Shanskyi N. M. (2009) Leksikologiya sovremennogo russkogo yazyka [Lexicology of modern Russian language]. Moscow, Librokom. 305 p. [in Russ.].

i Надоели баннеры? Вы всегда можете отключить рекламу.