Вестн. Моск. ун-та. Сер. 19. Лингвистика и межкультурная коммуникация. 2020. № 1
Т.В. Толстова
КОРПУСНЫЙ АНАЛИЗ ЖАНРОВЫХ КОНВЕНЦИЙ В РОССИЙСКИХ И ЗАРУБЕЖНЫХ АННОТАЦИЯХ К НАУЧНЫМ СТАТЬЯМ
Федеральное государственное автономное образовательное учреждение высшего образования «Самарский национальный исследовательский университет имени академика С.П. Королёва» 443086, Самара, Московское шоссе, 34
В статье анализируются культурно обусловленные отличия жанровых конвенций в аннотациях к научным статьям российских и зарубежных журналов по прикладной лингвистике. В ходе исследования использовались методы и инструменты корпусной лингвистики (частотные списки, ключевые слова, соотношение индивидуальных слов к общему числу слов, конкордансы, кластеры и т.д.) в сочетании с когнитивным подходом к анализу риторической структуры текста. Изменения в разные периоды времени отслеживались путем продольного сравнения.
Сравнительный анализ двух корпусов продемонстрировал их отличия с точки зрения общего объема (общее количество слов и предложений), преобладающей лексики (для словника в целом и для академической лексики в частности), основных семантических полей и риторической структуры. В частности, российским аннотациям присущи меньший объем, более простая структура, более широкая семантика глаголов инициального предложения и концентрация академической лексики вокруг предмета рассмотрения статьи. Зарубежные аннотации превосходят отечественные по объему, имеют выраженную риторическую структуру (цель - методы - результаты - заключение), более конкретные и разнообразные глаголы инициального предложения и преобладание академической лексики, связанной с методами исследования. В целом российские аннотации можно отнести к описательным, а зарубежные - к информативным.
Ключевые слова: аннотация к научной статье; авторское резюме; корпусная лингвистика; жанровый анализ; жанровые конвенции; риторическая структура; академическая лексика.
Введение. Интеграция российских университетов в глобальное научное и образовательное пространство повлекло за собой серьез-
Толстова Татьяна Витальевна - кандидат филологических наук, доцент кафедры иностранных языков и русского как иностранного Самарского национального исследовательского университета имени академика С.П. Королёва (e-mail: [email protected]).
ные изменения в работе преподавателей и ученых. В целях повышения конкурентоспособности университеты требуют от своих работников растущего числа публикаций в журналах, входящих в международные базы данных (таких как Scopus и Web of Science) и имеющих высокий импакт-фактор.
Чтобы статьи были прочитаны и процитированы, они должны быть написаны на английском языке, который сегодня является не только языком населения Великобритании или США, но языком международного общения. Академический английский язык можно считать своего рода Lingua Franca - особой (упрощенной и унифицированной) разновидностью английского языка, используемой мировым научным сообществом.
При этом публикация научной работы в международных журналах означает не только написание статьи на английском языке, но и совершенно иной подход к ее созданию, принятый в мировом академическом дискурсе, но зачастую отличающийся от подхода, принятого в отечественной культуре.
Как и другие аспекты культуры, эти отличия часто бывают невидимыми и неосознаваемыми. Иногда авторы просто переводят работу с русского на английский язык, а иногда пишут на английском, но придерживаются норм и конвенций, свойственных жанру российской научной статьи. Цель данной работы - выявить и проанализировать культурные отличия авторских резюме (аннотаций) к статьям в российских и зарубежных журналах.
Аннотации к научным статьям (abstracts) рассматриваются как «частичный жанр» или «фрагмент жанра» (part-genre). Если вся научная статья это «целый жанр», то ее разделы (введение, результаты, методы, аннотация и т.д.) являются «частичными жанрами» [Feak, Swales, 2009]. Под жанром в данной статье понимается «тип текста или дискурса, предназначенного для достижения определенного набора коммуникативных целей» [Swales, 2004: 61].
Т.Н. Хакин [Huckin, 2001] выделяет следующие четыре специфические функции аннотации:
1 - самостоятельный мини-текст, кратко характеризующий тему, методы и основные результаты исследования;
2 - средство просмотра (screening), помогающее читателю принять решение, читать полный текст статьи или нет;
3 - предварительное знакомство со структурой и содержанием статьи;
4 - указатель (index) для профессионалов (издателей и редакторов).
Сегодня, когда ежегодно публикуются миллионы научных статей и бесплатный доступ к текстам имеет ограниченный круг читателей, аннотация становится визитной карточкой статьи, будучи доступной для чтения всем желающим. Это позволяет специалистам утверждать, что аннотация более важна для читателя, чем для автора [Swales, Feak, 2004].
По своему содержанию и структуре аннотации делятся на описательные (indicative), дающие краткую общую характеристику работы, и информативные (informative), содержащие сведения о цели, методах и результатах исследования [Piqué-Noguera, 2012]. В точных науках и медицине всё чаще используется структурированная аннотация - когда такие основные компоненты, как цель (Aim), методы (Methods), результаты (Results) и выводы (Conclusions), четко озаглавлены и выделены особым шрифтом [Kitchenham et al., 2008]. В определении Американского национального института стандартов (ANSI) и аккредитованной им Национальной организации информационных стандартов (NISO) говорится, что аннотация (abstract) означает «краткое объективное представление содержания первичного документа или устного доклада»1. Там же четко разграничиваются описательные и информативные аннотации, в которых используются разные способы написания или разные ракурсы. В документе подчеркивается, что оба типа должны представлять как можно больше информации, содержащейся в тексте статьи.
Это, в свою очередь, вызвало тенденцию к увеличению общего объема аннотаций, который в среднем составляет 5-8 предложений и содержит 120-180 слов [Feak, Swales, 2009]. В «Методических рекомендациях по редакционной подготовке научных журналов для включения в зарубежные индексы цитирования ВИНИТИ РАН»2 указывается, что «объем текста авторского резюме определяется содержанием публикации (объемом сведений, их научной ценностью и/или практическим значением), но не должен быть менее 100-250 слов (для русскоязычных публикаций - предпочтительнее больший объем)».
В последние годы вопросу жанровых отличий аннотаций, написанных носителями разных языков и культур, посвящено значительное количество исследований [Kafes, 2012; Hu, Coa, 2011; Taylor,
1 ANSI/NISO.1997. Guidelines for abstracts. Revision of ANSI Z39.14-1979 (R1987). Bethesda, MD: American National Standards Institute, NISO Press.
2 Кириллова О.В. Методические рекомендации по редакционной подготовке научных журналов для включения в зарубежные индексы цитирования. М., 2012. С. 34-35.
Chen, 1991; Hirohata et al., 2008]. В данной работе рассматриваются культурные отличия жанровых конвенций в аннотациях к русскоязычным и англоязычным статьям.
Материалы и методы. Для выявления культурных отличий в аннотациях к журнальным статьям было создано два корпуса:
1) аннотации к статьям российского журнала по прикладной лингвистике (в дальнейшем - RUSS) за 2009-2015 гг. (209 текстов);
2) аннотации к статьям из международного журнала по прикладной лингвистике издательства Oxford Journals (в дальнейшем - INTL) 2009-2015 гг. (164 текста).
Выбор журналов было обусловлен их общей тематикой - прикладная лингвистика. Предполагалось также, что авторы российского журнала - специалисты в этой области - владеют английским языком в достаточной степени и вследствие этого основными источниками различий будут культурные, а не языковые. Сами статьи были написаны на русском языке, но аннотации - на русском и английском. Авторы международного журнала представляют различные страны и используют Academic English as Lingua Franca (ELFA) [Mauranen, 2003].
При создании корпуса и его количественном анализе использовались различные инструменты программного пакета WordSmith Tools (версия 4) Майка Скотта [Scott, 2009], включая частотные списки (frequency lists), соотношение индивидуальных слов к общему числу слов (type-token ratio), списки согласованности (consistency lists), конкордансы (concordances), кластеры (clusters) и т.д. [Толсто-ва, 2009].
Корпусное (количественное) исследование было дополнено когнитивным подходом [Nazarova, 2012] в виде анализа риторической (когнитивной) структуры аннотаций. Для выявления изменений в разные периоды времени использовалось продольное сравнение.
Результаты. Первое отличие, которое обращает на себя внимание при сравнении двух корпусов, это разная длина аннотаций. Российский корпус содержит 209 аннотаций, при этом общее количество слов (tokens) составляет 11321, а количество предложений -517. В международном корпусе, состоящем из 164 аннотаций, эти цифры - 27003 и 991, соответственно. Среднее количество предложений в российском корпусе - 2,5, а в международном - 6. Однако продольное сравнение (исследование изменения одних и тех же объектов на протяжении установленного периода времени) показывает тенденцию к выравниванию этих значений, и в 2015 г. они значительно сближаются (рис. 1 и 2).
Количество слов
Количество предложений
200 150 100 50 0
5
СО О т- см со 00 01 01 01 01 01 01
2222222
■ RUSS □ INTL
Рис. 1. Количество слов (running words) на аннотацию
■ RUSS □ INTL
Рис. 2. Количество предложений на аннотацию
Такие отличия можно объяснить тем, что авторы российских аннотаций придерживались прежних российских (и ранее - советских) конвенций, когда структуре аннотаций не придавалось столь большого значения, а небольшой объем был обусловлен требованиями «экономии». В настоящее время в изменившихся условиях наблюдается тенденция к следованию новым конвенциям.
При выявлении наиболее частотных знаменательных слов в аннотациях к журнальным статьям использовались частотные списки (frequency list tool). В табл. 1 приведены десять наиболее частотных десяти лемм - базовых форм слова без учета его грамматических изменений, таких как время или число [Biber, 2004]. Поскольку для каждого корпуса они отличны, в таблице они приведены в алфавитном порядке.
Для сравнения полученные данные были сопоставлены со списком академической лексики "A New Academic Word List" (AWL), составленным Эврил Коксхед [Coxhead, 2000; 2011]. Список содержит 1140 слов. В соответствии с частотностью список разделен на десять «подсписков» (sublists): подсписок № 1 содержит наиболее частотные слова, подсписок № 2 - следующие по частотности и т.д. В каждом подсписке даны «семейства» - совокупности разных словоформ и дериватов одного слова, например, «семейство» для слова analysis включает: analyze, analytical, analyst и т.п. Всего их 570. В нашем корпусе встречаются три слова, представленные в AWL: analysis (подсписок № 1), research (№ 1) и author (№ 6). Интересно отметить отсутствие в списке Э. Коксхед таких слов, как study и result, широко представленных в нашем корпусе и отражающих понятия, являющиеся неотъемлемой частью академического дискурса.
Таблица 1
Наиболее частотные знаменательные слова двух корпусов
лемма RUSS INTL Рейтинг в New Academic Word List (AWL)
Общее количество Нормированное количество (на 1000 слов) Рейтинг в десятке лидеров Общее количество Нормированное количество (на 1000 слов) Рейтинг в десятке лидеров
analysis 43 3.8 — 146 5.4 4 1
article 211 18.6 1 144 5.3 5 —
author 75 6.6 7 12 0.4 — 6
business 57 5.0 9 4 0.1 — —
communication 62 5.5 8 10 0.4 — —
discourse 81 7.2 4 66 2.4 — —
english 80 7.1 5 131 4.9 6 —
foreign 71 6.3 6 29 1.1 — —
language 156 13.8 2 276 10.2 1 —
learner 15 1.3 — 271 10.0 2 —
lexical 12 1.1 — 62 2.3 10 —
research 11 1.0 — 106 3.4 7 1
result 9 0.8 — 70 2.6 9 —
student 46 4.0 10 91 3.4 8 —
study 44 3.9 — 234 8.7 3 —
teaching 83 7.3 3 19 0.7 — —
Выделенные слова (article, English, language, student) являются преобладающими в обоих корпусах. Лемма article также является ядром самых частотных кластеров (слов, неоднократно употребляющихся вместе) в корпусе RUSS (табл. 2):
Таблица 2
Наиболее частотные кластеры корпуса RUSS
ARTICLE DEALS WITH 55
ARTICLE IS DEVOTED 33
IN THE ARTICLE 13
ARTICLE EXAMINES 12
ARTICLE DESCRIBES 12
Словарный состав академических текстов представлен тремя слоями лексики: слова общего английского языка (General English words), слова общего академического английского языка (General Academic English words) и специальные термины (Special Terminology). В табл. 1 присутствуют пять слов общего академического английского языка: analysis, author, research, result, study, три из которых (analysis, author, research) также включены в список AWL.
При выявлении частотности слов общего академического английского языка в обоих корпусах было также проведено их сопоставление с Academic Word List. Словник корпуса RUSS насчитывает 445 слов (types) из общего количества слов 1682 (running words), в то время как для корпуса INTL эти цифры составляют 920 и 4027 соответственно. Интересно отметить, что в обоих корпусах эти лексические единицы демонстрируют аналогичную долю в словнике (~23%) и в общем числе слов (~15%). В табл. 3 приведены 20 наиболее частотных слов общего академического английского языка из каждого корпуса. При этом каждое слово отнесено к определенному семантическому полю - связанной по смыслу группе слов, отражающих разные функционально-когнитивные составляющие аннотации к научной статье: самоидентификация (self-identification) - как сам автор номинирует свою работу и себя (I), вводная информация (background) - объяснения, предпосылки, история вопроса (B), цель исследования (purpose) - что запланировано сделать в работе (P), предмет рассмотрения (subject-matter) - лексика, связанная с тематикой исследования (SM), материалы и методы (materials and methods) - что и каким образом исследовалось (MM) и результаты (results) - что было выявлено в ходе исследования (R).
В корпусе RUSS больше всего представлены лексические единицы семантического поля «предмет рассмотрения» (14), а в корпусе INTL - «материалы и методы» (10). Лемма research в последнем корпусе используется как для самоидентификации (This research... ) так и во вводной информации, когда речь идёт об исследованиях других ученых.
Из общего числа 373 аннотаций только одну (RUSS) можно охарактеризовать как структурированную, поскольку она имеет эксплицитно выделенные разделы (Subject, Tasks, Methods, Newness). При этом названия данных разделов перекликаются с разделами, являющимися обязательными для введения к научной работе в отечественном научном дискурсе («тема», «задачи», «методы», «научная новизна»). В свою очередь, анализ употребления и местонахождения слов определенных семантических полей позволил выявить несколько коммуникативных ходов (moves) в составе когнитивной структуры аннотации: Purpose (purpose, aim), Methods
Таблица 3
Наиболее частотные слова общего академического английского языка в двух корпусах
RUSS INTL
ЛЕММА Количество Рейтинг в New Academic Word List Семантическое поле ЛЕММА Количество Рейтинг в New Academic Word List Семантическое поле
author 75 6 SI analysis 146 1 MM
communication 62 4 SM research 106 1 SI/B
processnoun 43 1 SM task 80 3 MM
analysis 43 1 MM data 59 1 MM
professional 40 4 SM participant 53 2 MM
text 38 2 MM interaction 47 3 SM
devoted 31 9 P complexity 41 2 MM
approach 31 1 MM role 41 1 SM
method 30 1 MM academic 36 5 SM
communicative 27 4 SM context 35 1 SM
aspect 27 2 SM acquisition 33 2 SM
functional 24 1 SM approach 30 1 MM
concept 24 1 SM instruction 29 6 SM
feature 21 2 SM theory 29 1 B
role 18 1 SM target 27 5 SM
specific 17 1 SM variation 23 1 MM
cultural 16 2 SM item 23 2 SM
media 16 7 SM verb process 22 1 MM
economic 14 1 SM found 21 9 R
strategy 14 2 SM input 20 6 MM
(method, approach, analysis, experiment, measure, assessment, compare, technique, participants, procedure, employ, based on и т.д.), Results and Discussion (result, findings, number, instance, shown, found, suggest), Conclusion (conclude, conclusion), Practical Implication (can be used,
practical implication). Большинство из них (за исключением Purpose) присутствуют преимущественно в корпусе INTL.
Коммуникативный ход Purpose реализуется по определенной модели: «самоидентификация» + «действие». Для самоидентификации в аннотациях корпуса RUSS используются такие существительные как article, paper, author, в то время как в INTL в этой функции выступают существительные study, research, а также личные местоимения первого лица we и I. Глаголы, используемые в первом предложении аннотации и описывающие, что будет сделано в статье, также отличаются. В корпусе RUSS они носят более общий, абстрактный характер: deal with (39), is devoted to (30), consider (18), examine (16), present (11), aim (8); в то время как в корпусе INTL они более конкретно характеризуют исследование: examine (59), investigate (49), argue (29), report (12), explore (12).
Заключение. Проведенный анализ позволил выявить наличие сходства в использовании лексики аннотаций к научной статье в российском и зарубежном журнале. В обоих корпусах преобладает лексика, связанная с общим направлением журналов - прикладной лингвистикой. В отношении общей академической лексики имеются некоторые отличия с точки зрения семантики данной группы слов - в российских аннотациях они концентрируются вокруг семантического поля «предмет рассмотрения», тогда как в зарубежных - «материалы и методы».
Основные различия в двух корпусах связаны прежде всего с общим объемом текста (количеством слов и предложений). Однако в последнее время наблюдается тенденция к увеличению объема текста в российских аннотациях и приближению их к международным конвенциям жанра аннотации к научной статье.
Другим важным отличием является семантика глаголов в инициальном предложении, выражающих характер работы. Более общая семантика глаголов в российских аннотациях в сочетании с преобладанием тематической лексики по отношению к академической лексике позволяет отнести российские аннотации к типу описательных, кратко указывающих на основной предмет рассмотрения. В свою очередь, в зарубежных аннотациях четко прослеживается воспроизводящаяся когнитивная структура Purpose - Methods -Results - Conclusion, присущая информативным аннотациям.
СПИСОК ЛИТЕРАТУРЫ
1. Назарова Т.Б. Когнитивный подход и корпусные исследования: соперничество,
союз или слияние? // Вопросы прикладной лингвистики. 2012. № 7. С. 48-54.
2. Толстова Т.В. Корпусная лингвистика в обучении английскому языку делового общения // Вопросы прикладной лингвистики. 2009. № 2. С. 66-70.
3. Biber D. Corpus linguistics: Investigating language structure and use. Cambridge, 2004.
4. Coxhead A. A new academic word list // TESOL Quarterly. 2000. No. 34. P. 213-238.
5. Coxhead A. The Academic Word List 10 years on: research and teaching implications. TESOL Quarterly. 2011. No. 45. P. 355-362.
6. Feak C.B., Swales J.M. Abstracts and the writing of abstracts. Ann Arbor, 2009.
7. Hirohata K., Okazaki N., Ananiadou S., Ishizuka M. Identifying sections in scientific abstracts using conditional random fields. Proceedings of the 3rd International Joint Conference on Natural Language Processing. 2008. P. 381-388.
8. Hu G., Coa F. Hedging and boosting in abstracts of applied linguistics articles: A comparative study of English- and Chinese-medium journals // Journal of Pragmatics. 2011. No. 43. P. 2795-2809.
9. Huckin T.N. Abstracting from abstracts // Academic writing in context / M. Hewings (Ed.). Birmingham, UK, 2001.
10. Kafes H. Cultural traces on the rhetorical organization of research article abstracts // International Journal on New Trends in Education and Their Implications. 2012. Vol. 3. Issue 3. P. 207-220.
11. Kitchenham B.A., Brereton O.P., Own S, Butcher J., Jefferies C. Length and readability of structured software engineering abstracts. IEP Proceedings - Software. 2012. No. 2. P. 37-45.
12. Mauranen A. Academic English as lingua franca - a corpus approach // TESOL Quarterly. 2003. No. 37. P. 513-527.
13. Piqué-Noguera C. Writing business research article abstracts: A genre approach // Iberica. 2012. No. 24. P. 211-232.
14. Scott M. WordSmith Tools, Version 5. Oxford, 2009.
15. Swales J.M. Research genres: Exploration and applications. Cambridge, 2004.
16. Swales J.M., Feak C.B. Academic Writing for Graduate Students: Essential Tasks and Skills. Ann Arbor, 2004.
17. Taylor G, Chen T. Linguistic, cultural, and sub-cultural issues in contrastive discourse analysis: Anglo-American and Chinese scientific texts // Applied Linguistics 12. 1991. P. 319-336.
Tat'yana V. Tolstova
CORPUS ANALYSIS OF GENRE CONVENTIONS IN RUSSIAN
AND INTERNATIONAL RESEARCH ARTICLE ABSTRACTS
Samara National Research University 34 Moskovskoye shosse, Samara, 443086
The paper aims at analyzing culture-specific differences in genre conventions of research article abstracts from Russian and international journals on Applied Linguistics. The study involves the use of various methods of corpus linguistics (such as frequency lists, key words type/token ratio, concordances, clusters, etc.) along with the cognitive approach to analyzing the rhetorical structure of the text. Variations over time are traced using longitudinal comparison.
The comparative analysis of the two corpora reveals differences between the abstracts in terms of their overall length (the total number of words and sentences),
prevailing vocabulary (for total number of tokens and for academic words), dominant semantic fields and rhetorical structure. Specifically, Russian abstracts are shorter and their structure is simpler. The verbs in the initial sentence are broader in meaning and the academic lexis centers around the subject-matter of the article. In contrast, international abstracts are longer having a manifested rhetorical structure (Purpose -Methods - Results - Conclusions). The verbs in the initial sentence are more variable and their meaning is more specific, whereas the academic vocabulary tends to relate to the methods of study. By and large, the Russian abstracts can be classified as indicative, while the international abstracts as informative.
Key words: research article abstract; indicative and informative abstracts; corpus linguistics; genre analysis; genre conventions; rhetorical structure; academic vocabulary.
About the author: Tat'yana V. Tolstova- PhD, Associate Professor ofthe Department of Foreign Languages and Russian as a Foreign Language, Samara National Research University (e-mail: [email protected]).
REFERENCES
1. Nazarova T.B. 2012. Kognitivnyi podkhod i korpusnye issledovaniya: sopernichest-vo, soyuz ili sliyanie? [Cognitive Approach and Corpora-Driven Approach: Rivalry, Alliance or Merging?]. Issues of Applied Linguistics, no. 7, pp. 48-54. (In Russ.)
2. Tolstova T.V. 2009. Korpusnaya lingvistika v obuchenii angliiskomu yazyku delo-vogo obshcheniya [Corpus Linguistics in Teaching Business English]. Issues of Applied Linguistics, no. 2, pp. 66-70. (In Russ.)
3. Biber D. 2004. Corpus linguistics: Investigating language structure and use. Cambridge University Press.
4. Coxhead A. 2000. A new academic word list. TESOL Quarterly, no. 34, pp. 213-238.
5. Coxhead A. 2011. The Academic Word List 10 years on: research and teaching implications. TESOL Quarterly, no. 45, pp. 355-362.
6. Feak C.B., Swales J.M. 2009. Abstracts and the writing of abstracts. Ann Arbor, The University of Michigan Press.
7. Hirohata K., Okazaki N., Ananiadou S., Ishizuka M. 2008. Identifying sections in scientific abstracts using conditional random fields. Proceedings of the 3rd International Joint Conference on Natural Language Processing, pp. 381-388.
8. Hu G., Coa F. 2011. Hedging and boosting in abstracts of applied linguistics articles: A comparative study of English- and Chinese-medium journals. Journal of Pragmatics, no. 43, pp. 2795-2809.
9. Huckin T.N. 2001. Abstracting from abstracts. In Hewings M. (ed.) Academic writing in context, Birmingham, UK, University of Birmingham Press.
10. Kafes H. 2012. Cultural traces on the rhetorical organization of research article abstracts. International Journal on New Trends in Education and Their Implications, Volume 3, issue 3, pp. 207-220.
11. Kitchenham B.A., Brereton O.P., Own S., Butcher J., Jefferies C. 2012. Length and readability of structured software engineering abstracts. IEP Proceedings - Software, no. 2, pp. 37-45.
12. Mauranen A. 2003. Academic English as lingua franca - a corpus approach. TESOL Quarterly, no. 37, pp. 513-527.
13. Piqué-Noguera C. 2012. Writing business research article abstracts: A genre approach. Iberica, no. 24, pp. 211-232.
14. Scott M. 2009. WordSmith Tools, Version 5. Oxford, Oxford University Press.
15. Swales J.M. 2004. Research genres: Exploration and applications. Cambridge, Cambridge University Press.
16. Swales J.M., Feak C.B. 2004. Academic Writing for Graduate Students: Essential Tasks and Skills. Ann Arbor, The University of Michigan Press.
17. Taylor G., Chen T. 1991. Linguistic, cultural, and sub-cultural issues in contrastive discourse analysis: Anglo-American and Chinese scientific texts. Applied Linguistics, no. 12, pp. 319-336.