Научная статья на тему 'Специфика корпусных исследований в современном китайском языкознании'

Специфика корпусных исследований в современном китайском языкознании Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
1159
211
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОРПУСНОЕ ИССЛЕДОВАНИЕ / КОРПУС / КИТАЙСКИЙ ЯЗЫК / CCL / BCC / ЧАСТОТНОСТЬ ИЕРОГЛИФА / CORPUS STUDY / CORPUS / CHINESE LANGUAGE / FREQUENCY OF CHARACTERS

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Юэ Фэн

В работе рассмотрены ранние этапы создания корпуса китайского языка и его сегодняшнее состояние. Первые попытки создания корпуса ориентируются на определение частотности иероглифа в целях оптимизации преподавания китайского языка. В настоящее время функционируют такие масштабные корпусы китайского языка, как корпус общего современного китайского языка, корпус CCL, BCC и корпус Синика. Каждый корпус имеет собственную специфику и предоставляет поддержку исследования и преподавания китайского языка.The paper describes the early stages of creating the Chinese language corpus and its current state. The first attempts to create a corpus were based on the frequency of the character and were made with a view to optimizing the teaching of Chinese. Currently, there are four large-scale Chinese language corpora, such as the General modern Chinese language corpus, CCL, BCC, and the Sinica corpus. Each is quite specific, however all four are used for the purpose of teaching and learning the Chinese language .

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Специфика корпусных исследований в современном китайском языкознании»

УДК 81-119

Фэн Юэ

аспирант кафедры общего и сравнительного языкознания Московского государственного лингвистического университета; e-mail: [email protected]

СПЕЦИФИКА КОРПУСНЫХ ИССЛЕДОВАНИЙ В СОВРЕМЕННОМ КИТАЙСКОМ ЯЗЫКОЗНАНИИ

В работе рассмотрены ранние этапы создания корпуса китайского языка и его сегодняшнее состояние. Первые попытки создания корпуса ориентируются на определение частотности иероглифа в целях оптимизации преподавания китайского языка. В настоящее время функционируют такие масштабные корпусы китайского языка, как корпус общего современного китайского языка, корпус CCL, BCC и корпус Синика. Каждый корпус имеет собственную специфику и предоставляет поддержку исследования и преподавания китайского языка.

Ключевые слова: корпусное исследование; корпус; китайский язык; CCL; BCC; частотность иероглифа.

Feng Yue

PhD Student, Department of General and Comparative Linguistics, Moscow State Linguistic University; e-mail: [email protected]

The paper describes the early stages of creating the Chinese language corpus and its current state. The first attempts to create a corpus were based on the frequency of the character and were made with a view to optimizing the teaching of Chinese. Currently, there are four large-scale Chinese language corpora, such as the General modern Chinese language corpus, CCL, BCC, and the Sinica corpus. Each is quite specific, however all four are used for the purpose of teaching and learning the Chinese language .

Key words: corpus study; corpus; Chinese language; CCL; BCC; frequency of characters.

В современном представлении под корпусом понимается коллекция текстов, созданных в естественной речевой среде и отобранных для того, чтобы охарактеризовать состояние или вариацию языка [Sinclair 1991]. Сегодня корпус широко использован в разных сферах лингвистики и других науках.

SPECIFICITY OF CORPUS STUDIES IN CONTEMPORARY CHINESE LINGUISTICS

Введение

Основы корпусных исследований в Китае были заложены в 1920-е гг. С конца 1970-х гг. в Китае появились машиночитаемые корпусы. Сегодня существуют и развиваются несколько масштабных корпусов китайского языка. В данной работе рассматриваются первые попытки китайских ученых в создании национального корпуса и наиболее существенные корпусы в Китае.

Основными источниками данной работы являются Chinese Corpus online, корпус CCL, BCC и корпус Синика. В ней также использованы современные публикации китайских ученых по проблемам корпусной лингвистике.

В качестве методов исследования используются концептуальный, контекстуально-интерпретативный методы и сопоставительный анализ.

Цель работы состоит в том, чтобы посредством раскрытия ранних этапов создания корпуса китайского языка и его современного состояния выявить специфику корпусных исследований в Китае.

Ранние этапы создания корпусов китайского языка

В Китае создание корпусов китайского языка берет свое начало в 1920-х гг. В то время некоторые ученые изучали частотность употребления иероглифов при помощи статистических методов, чтобы в итоге составить список базовых иероглифов китайского языка. Объём таких корпусов сначала был крайне невелик. Однако эти первые попытки заложили основу корпусных исследований в Китае и стали в известном смысле прототипами современных корпусов китайского языка 2002, с. 129].

В 1925 г. китайский педагог Чэнь Хэцинь 1892-1982) на

базе статистических данных языкового материала составил «Список прикладных иероглифов Байхуа (современный литературный китайский язык. - Прим. Ф. Ю.)» ( Оп^^ШД^^О ) в лингводидакти-ческих целях. Результаты данного исследования были опубликованы коммерческим издательством в 1928 г. и представляли

собой в итоге 4261 базовых иероглифов на основе выборки из более чем 550 тыс. иероглифов. Источники этой выборки представлены в таблице 1 [Ш§# 2014, с. 96-99].

В конце книги была размещена Таблица соответствия иероглифов и их частотности. Знаменитый педагог Тао Синчжи (Цт^П 1891-1946) в предисловии к данной работе написал: «Это исследование послужит

Таблица 1

Источники «Списка прикладных иероглифов Байхуа» 1928 г.

Типы Количество иероглифов

Детская литература 127 293

Газеты 153 334

Женские журналы 90 142

Литература для внеклассного чтения 51 807

Древние и современные романы 71 267

Разное 60 625

Итог 554 478

основанием для составления школьного учебника и внесет большой вклад в просвещение нашей страны» 2002, с. 130]. В таком

понимании «Список прикладных иероглифов Байхуа» Чэнь Хэциня представлял собой первый труд по статистическому подсчету частотности употребления иероглифов современного китайского языка и закладывал основы для дальнейших корпусных исследований в Китае.

С 1979 г. в Китае начали создавать машиночитаемые корпусы китайского языка. В частности, речь шла о четырех наиболее существенных разработках:

1) «Корпусе современной литературы китайского языка» (1979 г.) объёмом в 5,27 млн иероглифов, разработчик - Уханьский университет;

2) «Корпусе современного китайского языка» (1983 г.) - 20 млн иероглифов, Пекинский университет авиации и космонавтики;

3) «Корпусе школьных учебников по филологии» (1983 г.) -1,068 млн иероглифов, Пекинский педагогический университет;

4) «Корпусе частотности слов современного китайского языка» (1983 г.) - 1,82 млн иероглифов, Пекинский институт языков

2002, с. 130].

На основании результатов последнего корпуса был составлен и издан в 1986 г. «Частотный словарь современного китайского языка».

Таблица 2

Источники «Частотного словаря современного китайского языка» 1986 г.

Виды Количество иероглифов Процент(%)

Газеты 440 799 24,39

Научно-популярные издания 284 308 15,73

Сценарии и устный материал 201 892 11,17

Литература 880 399 48,71

Объём языкового материала составил тогда уже более 1,82 млн иероглифов. Виды источников и их процентное соотношение в общем объёме проиллюстрированы в таблице 2.

Важно отметить, что литература различных стилей занимает почти половину объёма данного материала. Эти литературные труды публиковались, в основном, в период 1940-1970-х гг.

В этом Словаре представлены различные итоговые таблицы, в том числе таблицы слов с высокой частотностью использования в таких стилях современного китайского языка, как газетный, научно-популярный, разговорный и литературный. Кроме того, в него включены также таблицы слов с высокой и низкой частотностью употребления, таблицы с результатами анализа продуктивности слов и др.

1986]. Научная ценность данного словаря обоснована не только удачным отбором материала разных стилей в процессе статистической выборки, но и собственно методами подсчета данных и составления таблиц.

«Частотный словарь современного китайского языка» является первым словарем в Китае со статистическим анализом как отдельных иероглифов, так и речевых единиц, представляет собой значительное достижение в квантитативном исследовании китайского языка. В целом, он имеет большую справочную ценность для обработки различной информации в области китайского языка, преподавания этого языка, лингвистических исследований и других соответствующих сфер ШШ 1989].

Что касается характеристик ранних машиночитаемых корпусов китайского языка, то, во-первых, большинство данных вводилось вручную, что требовало от исследователей значительных затрат времени и усилий. Объём этих корпусов был небольшим, в их создании отсутствовал какой-либо единый стандарт. Во-вторых, при обработке материала для корпусов обнаружились два вида строк неоднозначных сегментаций (ambiguous segmentation strings): двусмысленность при пересечении значений (ШШШ: ШШ - поверхность земли, ШШ - размер территории) и амбигуентность комбинации иероглифов (ДЬ: скоро; на лошади) при сегментации слов. В-третьих, работа на данном этапе привела в октябре 1990 г. к разработке и опубликованию госстандарта GB-1371 - «Стандарт сегментации слов современного китайского языка при обработке информации» 2002, с. 132].

Таким образом, в этот период было изучено и решено несколько фундаментальных вопросов разработки машиночитаемых корпусов китайского языка. Эти попытки создания машиночитаемых корпусов в 1980-е гг. стали существенным фактором для дальнейшего развития корпусов китайского языка больших объёмов.

Основные корпусы китайского языка в настоящее время

В настоящее время в Китае наиболее важными корпусами являются четыре, а именно:

1. Корпус общего современного китайского языка

В 1991 г. Комитет по работе в области языка и письменности Китая начал создавать масштабный корпус китайского языка на государственном уровне, чтобы способствовать теоретическим исследованиям китайского языка, оптимизации его преподавания, одновременно и предоставить ресурсы для его компьютерной обработки. В январе 1993 г. были составлены «Принципы подбора материала к корпусу современного китайского языка». В конце 1998 г. этот корпус был представлен в первой, неаннотированной, версии в объёме 70 млн единиц.

На данный момент общий объём корпуса составляет 100 млн единиц, в том числе - языковой материал 1919-1997 гг. в объеме 70 млн знаков с ручным набором, а также материал 1997-2002 гг. -30 млн знаков (50 % введенных ручным набором и 50 % электронных

Таблица 3

Типы и объем текстов в аннотированном корпусе современного китайского языка

Типы Количество знаков (млн) Процент (%)

Материал гуманитарных и общественных наук 30 60

Материал естественных наук 3 6

Газета и журнал 13 26

Материал делового стиля 4 8

Итог (млн) 50

текстов). Источники материала представлены тремя типами: материал гуманитарных и общественных наук (50 %), материал естественных наук (30 %) и разное (20 %) 2012].

Кроме того, половина текстов является аннотированной. Их типы и объём отражены в таблице 3.

Этот электронный комплекс представляет собой сбалансированный корпус в связи с огромным объемом и необходимым по этой причине ограничением в пропорциях языкового материала. Состав материала гуманитарных и общественных наук в аннотированном корпусе представлен в таблице 4, где четко просматривается его сбалансированность в подборе материала.

На сайте данного корпуса Chinese Corpus online предоставлены программы автоматической сегментации текстов, частеречной разметки слов, подсчета частотности слов и разметки пиньиня. С помощью таких программ обеспечивается принципиальная возможность обработки текстов современного китайского языка в целях корпусной лингвистики. Принципы разметки и сегментации потока иероглифов в тексте подробно освещаются в [Лу Исинь 2016]. Подробная информация по обработке корпуса представлена в [Щ^ХДп ••• 2005].

На сайте Chinese Corpus online также размещен корпус древнекитайского языка. Он насчитывает 70 млн иероглифов и включает

Таблица 4

Типы и пропорция текстов гуманитарных и общественных наук в аннотированном корпусе современного китайского языка

Типы Пропорция (в %) Количество знаков (млн) 1919-1925 1926-1949 1950-1965 1966-1976 1977-

5% 15% 25% 5% 50%

Философия 8,3 2,5 0,125 0,375 0,625 0,125 1,25

История 8,3 2,5 0,125 0,375 0,625 0,125 1,25

Общество 8,3 2,5 0,125 0,375 0,625 0,125 1,25

Экономика 8,3 2,5 0,125 0,375 0,625 0,125 1,25

Искусство 8,3 2,5 0,125 0,375 0,625 0,125 1,25

Литература 50 15 0,75 2,25 3,75 0,75 7,5

Другие 8,3 2,5 0,125 0,375 0,625 0,125 1,25

Итоги 100 30 1,5 4,5 7,5 1,5 15

языковой материал с начала правления династии Чжоу (1122-249 г. до н. э.) по период династии Цин (1644-1911), а также большую часть «Сыку цюаньшу» (Энциклопедии четырех книгохранилищ, полного собрания классических произведений различных династий. -Прим. Ф. Ю.). В корпус включены классические труды Ши цзин, Шаншу, Чжоу и, Лао Цзы, Лунь юй, Мэн-цзы, Цзо-чжуань, «Чуские строфы», Да сюэ, Чжун юн, «Эръя», Ши цзи, «Планы сражающихся царств», «Возвышение в ранг духов», «Троецарствие», «Речные заводи», «Путешествие на Запад», «Сон в красном тереме» и многие другие.

Таким образом, материал корпуса, созданного при Комитете по работе в области языка и письменности Китая, многообразен, охватывает длительный период и предоставляет возможность цифровой обработки текстов. Однако в нем отсутствует языковой материал нового столетия.

2. Корпус CCL при Пекинском университете

С 2000 г. центр исследования китайской лингвистики (Center for Chinese Linguistics PKU) и исследовательский институт компьютерной лингвистики Пекинского университета (Institute of Computational Linguistics PKU) начали совместно создавать корпус китайского языка. Первая версия корпуса была принята в работу в 2004 г. Далее корпус ожидали пополнение материала и обновление функций поисковой системы в 2006, 2009 и 2014 гг. Эта система корпуса обновляется непрерывно и по сей день.

Корпус CCL состоит из корпуса современного, древнекитайского языков и параллельного китайско-английского корпуса [Ш^Ш 2003].

Объём «Корпуса современного китайского языка» составляет 600 млн единиц, в том числе 500 млн иероглифов. Языковой материал, который охватывает период с 1919 г. по 1949 г., занимает 1,28 % корпуса, в нем представлены две группы текстов - художественная литература (92,15 %) и пьесы (7,85 %). Материал после 1949 г. занимает 98,72 % корпуса и отражает десять типов текстов (см. табл. 5).

В категорию газет были включены не только наиболее важные газеты, например, номера «Жэньминь Жибао» за 1993-1996, 1998 и 2000 годы, тексты агентства Синьхуа за 2001-2004 гг., но и популярные журналы, например, номера 2-206 «Душу» («Чтение книг»),

Таблица 5

Типы и пропорции текстового материала после 1949 г. в структуре Корпуса современного китайского языка CCL

Тип Пропорция(в %)

Газеты 71,45

Переводы 7,66

Беллетристика 7,25

Электронные ресурсы 4,65

Деловая документация 4,11

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Сценарии сериалов и фильмов 1,82

Научные тексты 1,76

Исторические биографии 0,75

Театральные произведения 0,3

Устные беседы 0,26

«Читатель» и др. В итоге этот подкорпус является самым значительным в общем корпусном материале.

Объем корпуса древнекитайского языка составляет 200 млн единиц, в том числе 163,7 млн иероглифов. Материал охватывает период с династии Чжоу до 1949 г., причем языковой материал от династии Цин занимает довольно существенную его часть - 29,33 %.

Параллельный китайско-английский корпус включает в себя 233,6 тыс. пар предложений - оригинальных и их переводов, примерно 6 млн китайских иероглифов и 4 млн английских слов. В нем представлены три вида источника текстов - деловая документация, художественная литература, тексты СМИ ... 2019, с. 74].

Стоит отметить, что корпус CCL является неаннотированным, он только предоставляет в распоряжение исследователя оригинальные тексты с некоторой информацией об их классификации. В нем отсутствуют также лексическая и синтаксическая разметки, зато предлагается разветвленная поисковая система (подробнее см. в ЙЬжЖ^ ... 2019]).

3. Корпус BCC

Корпусный центр при Пекинском университете языка и культуры (BLCU Corpus Center - сокр. BCC) является крупнейшим корпусом китайского языка в мире. Его объём составляет 15 млрд иероглифов, в том числе - языковой материал газет (2 млрд), художественной литературы (3 млрд), социальной сети Weibo (3 млрд), науки и техники (3 млрд), общекитайского языка (1 млрд), древнекитайского языка (2 млрд) и других сфер. Все разделы корпуса приняты в работу в 2014 г., а его подкорпус HSK запустили в эксплуатацию еще в 2007 г.

Корпус BCC имеет следующие характеристики:

а) в данный момент корпус содержит материал девяти языков, в том числе английский, испанский, французский, немецкий, турецкий и др. Главным источником англоязычного материала является The Wall Street Journal, объём которого в корпусе достиг 1,2 млрд слов. Кроме того, разработаны параллельные корпусы: английско-китайский, английско-немецкий и др. В поисковой системе возможно, однако, использование только слов в начальной форме, но не поддерживается поиск слов с морфологическим изменением [^ШМ ... 2016];

б) корпус включает неаннотированный материал, материал с сегментацией слов, частеречной разметкой и treebank. В настоящее время сделана частеречная разметка для материала современного китайского языка, английского и французского языков, остальной материал является неаннотированным. Корпус содержит treebank китайского и английского языков, который заимствован из Penn treebank;

в) корпус соединяет в себе материал и современного, и древнекитайского языков;

г) источники современного китайского языка различны по стилям: газетные тексты («Ежедневная газета Сямэнь», «Вечерняя газета Сямэнь» и др.), устный материал (из социальной сети Weibo 2013 г.), наука и техника (научные журналы Китая), художественная литература (китайские и зарубежные литературные труды) и др. К беллетристическим и публицистическим текстам прилагается header с информацией о названии, авторах, времени выхода и другой информации, существенной для поиска в корпусе;

д) сочетание синхронического и диахронического поиска. Темпоральная разметка публицистических и беллетристических материалов позволяет осуществлять синхронный поиск. Диахронический

Таблица 6

Тип и процент материала к корпусу Синика

Типы Процент(%)

Философия 8

Наука 8

Общество 38

Искусство 5

Жизнь 28

Литература 13

Итог 100

поиск основан на использовании газетных текстов из «Жэньминь жибао» («Народная ежедневная газета») 1945-2015 гг. и представлен в графической визуализации [Щ^ХДп ... 2015].

Тем самым, BCC представляет собой масштабный корпус, всесторонне отражающий состояние современного китайского языка, однако требующий производить самостоятельную выборку подкорпусов в связи с многообразием его материала.

4. Корпус Синика

Таким образом, сбалансированный корпус современного китайского языка, созданный сотрудниками Академии Синика на Тайване (сокр. Sinica Corpus) представляет собой аннотированный корпус с частеречной разметкой. В нем примерно 11 млн слов (17 млн иероглифов). Тексты отражают публикации 1981-2007 гг. Типы и процентное соотношение материалов по темам отражены в таблице 6.

Небольшая по объёму пробная версия Sinica Corpus была открыта для академического сообщества в 1994 г. Последняя версия корпуса 4.0 была обновлена в 2006 г. Тексты для корпуса извлекались из различных областей и классифицируются по пяти критериям: жанру, стилю, типу, теме и источнику [Sinica Corpus URL]. Однако поисковая система корпуса поддерживает лишь ввод в формате иероглифа традиционного написания, но не в упрощенной версии.

Таким образом, эти четыре масштабных главных корпуса с собственной спецификой обеспечивают корпусную поддержку исследования и преподавания китайского языка.

Заключение

Ранние корпусы китайского языка были разработаны преимущественно для определения частотности иероглифа в целях оптимизации преподавания китайского языка. Современные корпусы китайского языка проходят очень интенсивный период развития, входят в группу гигакорпусов, предлагают программное обеспечение для быстрого поиска лингвистической информации и широко используются в разных сферах науки.

СПИСОК ЛИТЕРАТУРЫ

Лу Исинь. Принципы создания корпусов китайского языка // Известия Российского государственного педагогического университета им. А. И. Герцена. 2016. № 181. С. 22-29. Sinclair J. Corpus, concordance, collocation. Oxford University Press, 1991. Sinica Corpus. URL : asbc.iis.sinica.edu.tw/ (дата обращения: 01.12.2019).

/ МШМ // 2019. т. 6. № 1.

С. 71-86. = Разработка корпуса CCL при Пекинском университете / Чжэнь Вэйдун [и др.] // Корпусная лингвистика. 2019. T. 6. № 1. С. 71-86.

ШФ^ШД^С // 2014. Т. 1. № 1. С. 94-113 = Чэнь

Хэцзинь. Список прикладных иероглифов Байхуа // Корпусная лингвистика. 2014. Т. 1. № 1. С. 94-113.

/ // 2016. т. 3. № 1.

C. 93-118 = Разработка корпуса BCC на фоне больших данных / Сюнь Эньдун [и др.] // Корпусная лингвистика. 2016. Т. 3. №. 1. С. 93-118.

. Фа^Ш^ЖЙШ^Ш^ // Journal of Chinese Language and Computing. 2002. Т. 11. № 2. С. 127-136 = Фэн Чживэй. История и состояние исследования корпусов в Китае // Журнал китайского языка и вычислительной техники. 2002. Т. 11. № 2. С. 127-136. тш. // 1989.

№ 1. C. 120-127 = Ли Чжаолинь. Квантитативное исследование китайского языка : рецензия на «Частотный словарь современного китайского языка» // Лексикографическое исследование. 1989. № 1. С. 120-127. ШШтаШй^ЖЖШЖ^ШД / шда // ФЖ&«. 2015. T. 29. № 3. C. 169-176 = Создание и применение системы диахронического

поиска китайского слова / Сюнь Эньдун [и др.] // Журнал обработки информации китайского языка. 2015. T. 29. № 3. С. 169-176. Щ^ШШ^МЛ. 1986. 1491 с. = Частотный

словарь современного китайского языка. Пекин : Изд-во Пекинского института иностранных языков, 1986. 1491 с. ЩЖтШ^ШЖШ! / И» // шятад. 2005. № 2. C. 111-120 = Создание и глубокая переработка корпуса современного китайского языка / Цзинь Гуанцзинь [и др.] // Применение языка и письма. 2005. № 2. С. 111-120. Ма. ЩШиШЩХШЛ^ЩШ^Щ. 2012. URL : corpus.zhonghuayuwen.org/ resources.aspx (ОДЧЕШ: 01.12.2019) = Сяо Хан. Представление о корпусе современного китайского языка при Комитете по работе в области языка и письменности Китая. 2012. URL : corpus.zhonghuayuwen.org/ resources.aspx (дата обращения: 01.12.2019).

2003. URL :

ccl.pku.edu.cn:8080/ccl_corpus ШИВЯ: 01.12.2019) = Чжэнь Вэйдун, Го Жуй, Шэнь Ижун. Корпус CCL при центре исследования китайской лингвистики Пекинского университета. 2003. URL : ccl.pku.edu.cn:8080/ ccl_corpus (дата обращения: 01.12.2019).

REFERENCES

Lu Isin'. Principy sozdanija korpusov kitajskogo jazyka // Izvestija Rossijskogo gosudarstvennogo pedagogicheskogo universiteta im. A. I. Gercena. 2016. № 181. S. 22-29.

Sinclair J. Corpus, concordance, collocation. Oxford University Press, 1991. Sinica Corpus. URL : asbc.iis.sinica.edu.tw/ (data obrashhenija: 01.12.2019).

/ // 2019. т. 6. № 1.

S. 71-86. = Razrabotka korpusa CCL pri Pekinskom universitete / Chzhjen' Vjejdun [i dr.] // Korpusnaja lingvistika. 2019. T. 6. № 1. S. 71-86.

// ^й^^а^. 2014. т. 1. № 1. S. 94-113 = Chjen' Hjeczin'. Spisok prikladnyh ieroglifov Bajhua // Korpusnaja lingvistika. 2014. T. 1. № 1. S. 94-113.

лшшйтвшш^шш / // 2016. т. 3. №

1. C. 93-118 = Razrabotka korpusa BCC na fone bol'shih dannyh / Sjun' Jen'dun [i dr.] // Korpusnaja lingvistika. 2016. T. 3. №. 1. S. 93-118. Ж^. ФВ^Ш^Ш^Ш^Ж // Journal of Chinese Language and Computing. 2002. T. 11. № 2. S. 127-136 = Fjen Chzhivjej. Istorija i sostojanie issledovanija korpusov v Kitae // Zhurnal kitajskogo jazyka i vychislitel'noj tehniki. 2002. T. 11. № 2. S. 127-136.

«М. // тшя. 1989.

№ 1. С. 120-127 = Li Chzhaolin'. Kvantitativnoe issledovanie kitajskogo jazyka - Recenzija па «Chastotnyj slovar' sovremennogo kitajskogo jazyka> // Leksikograficheskoe issledovanie. 1989. № 1. S. 120-127.

ШШтаШй^ЖЖШЖ^ШД / // 2015.

Т. 29. № 3. С. 169-176 = Sozdanie i primenenie sistemy diahronicheskogo poiska kitajskogo slova / Sjun' Jen'dun р dr.] // Zhumal obrabotki informacii kitajskogo jazyka. 2015. Т. 29. № 3. S. 169-176.

Щ^ШШ^МЛ. 1986. 1491 с. = Chastotnyj

slovar' sovremennogo kitajskogo jazyka. Pekin: Izdatel'stvo Pekinskogo instituta inostrannyh jazykov. 1986. 1491 s.

Щ^ШтШМЖШП! / // ШЯ^ШД. 2005. № 2. С. 111-

120 = Sozdanie i glubokaja pererabotka korpusa sovremennogo kitajskogo jazyka / Czin' Guanczin' [i dr.] // Primenenie jazyka i pis'ma. 2005. № 2. S. 111-120.

Мл. 2012. URL : corpus.zhonghuayuwen.org/

resources.aspx (г^ИВЯ: 01.12.2019) = Sjao Han. Predstavlenie о ^фше sovremennogo kitajskogo jazyka pri Котке!е po rabote V oblasti jazyka i pis'mennosti Kitaja. 2012. URL : corpus.zhonghuayuwen.org/resources.aspx (data obrashhenija: 01.12.2019).

ЮИШвЙЙЖ. 2003. URL :

cd.pku.edu.cn:8080/cd_corpus ШИВЯ: 01.12.2019) = Chzhjen' Vjejdun, Go Zhuj, Shjen' ^Мп. Korpus CCL pri centre issledovanija kitajskoj lingvistiki Pekinskogo universiteta. 2003. URL : cd.pku.edu.cn:8080/cd_ corpus (data obrashhenija: 01.12.2019).

i Надоели баннеры? Вы всегда можете отключить рекламу.