Научная статья на тему 'Грамматика и корпус: очередная международная конференция по корпусной лингвистике в Чехии'

Грамматика и корпус: очередная международная конференция по корпусной лингвистике в Чехии Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
68
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Грамматика и корпус: очередная международная конференция по корпусной лингвистике в Чехии»

В заключение А.Е. Кузнецов констатировал, что в нашем обществе нет филологической культуры как признанного элемента государства. Поэтому важно учитывать тысячелетний удачный опыт в области политики языка, не использовать который было бы странно, тем более что по многим признакам мы находимся в ситуации, близкой к той, в которой находился сам Маворций.

В развернувшейся затем продолжительной дискуссии обсуждались вопросы соотношения формальной политики и социального стереотипа (на примере таких личностей, как Плиний или Цезарь), а также возможности реально повлиять на современную политику методами древних цивилизаций. А.Е. Кузнецов еще раз подчеркнул, что важно не пропагандировать решение проблемы, а сформулировать ее. Н.Н. Казанский предложил переиздать книгу И.В. Цветаева «Из жизни высшей школы римской империи» с новым предисловием и рассказал о своем намерении представить курс латинской лексикологии, где будут затронуты проблемы билингвизма и приличия/неприличия в языке.

После этого Н.Н. Казанский поблагодарил всех участников и особенно М.Н. Славятинскую за организацию круглого стола. Подытоживая все произнесенное на заседании, Н.Н. Казанский заключил, что на круглом столе был намечен тот вклад, который изучение классических языков может сделать в преподавание русского и иностранных языков. Важно напоминать о том, что мы обладаем тысячелетней историей, античная культура достаточно богата, чтобы использовать ее разные аспекты. В дополнение к этому М.Н. Славятинская предложила образовать при кафедре Центр греко-латинской словесности.

А.И. Солопов, А.И. Золотухина

вестник МОСКОВСКОГО университета. СЕР. 9. ФИЛОЛОГИЯ. 2008. № 3

грамматика и корпус: очередная международная конференция по корпусной лингвистике в чехии

С 25 по 27 сентября 2007 г. Институт чешского языка Академии наук Чешской Республики проводил очередную Международную конференцию по корпусной лингвистике Grammar & Corpora 20071, в которой приняло участие около 100 исследователей из 10 стран Европы, Азии и Америки и которая явилась органичным продолжением конференции Grammar & Corpora2, состоявшейся в Праге в 2005 г.

Большая часть докладов так или иначе была связана с проблематикой чешских корпусов, и прежде всего с разрабатываемым

на философском факультете Карлова университета в Праге и доступным через Интернет Чешским национальным корпусом3, однако были также представлены результаты исследований иных корпусов, в том числе корпусов других языков, а также выступления общетеоретического характера.

Конференцию открыли директор Института чешского языка К. Олива и председатель оргкомитета конференции заведующий отделением грамматики института Фр. Штиха.

На трех пленарных заседаниях выступили Х. Маир (Фрейбург), А.А. Поликарпов (Москва), М. Фрид (Принстон) и К. Олива (Прага). Х. Маир говорил о возможностях прогнозирования с опорой на корпусные данные, изменений в современном английском языке, А.А. Поликарпов — об использовании корпусных исследований в неодериватологии. М. Фрид рассмотрела, используя материал Чешского национального корпуса, поссесивность как делимитативную и грамматическую категорию, К. Олива — изменение современной научной парадигмы в связи с развитием корпусной лингвистики.

Остальные доклады были прочитаны на секционных заседаниях.

Фр. Штиха (Прага) на обширном чешском и немецком корпусном материале проанализировал теоретическую проблему соотношения узуса, частотности и грамматикализованности. М. Вондрачек (Прага, Градец Кралове), исследуя употребление форм номинатива, вновь затронул проблему соотношения формы и функции.

Основная часть секционных выступлений была посвящена исследованиям на материале Чешского национального корпуса. так, В. Бенешова (Прага) рассмотрела модальные характеристики придаточных предложений с побудительной семантикой; А. Изотов (Москва) — формы аналитического императива; Х.А. Калеро Диаз (Гранада) — семантику verba dicendi; Г. Конечна (Брно) и М. Прошек (Прага) — причастия прошедшего времени глаголов типа tisknout; Я. Билкова (Градец Кралове) — (псевдо)тавтологические сочетания типа Osud je osud; Ф. Эсван (Неаполь) — вариативность вторичных имперфективов; М. Хебал-Езерска (Варшава, Прага) — морфологическую вариативность; Я. Главачова (Прага) — орфографические варианты в связи с морфологической разметкой; М. Хиршова (Либерец) — пространственный дейксис; Я. Гоффманова (Прага) и И. Коларжова (Брно) — составные темпоральные коннекторы с компонентами nez, co; В. Индра (Прага) — двувидовые глаголы иноязычного происхождения; И. Коларжова (Прага) — дейк-тические местоимения в предложениях, содержащих глаголы движения; С. Кресин (Лос-Анджелес) — указательное местоимение ten; Р. Мейер (Регенсбург) — чешский кондиционал в конт-рафактических конструкциях; К. Осолсобе (Брно) — проблемы исправления ошибок автоматического морфологического анализа; Т. Елинек (Прага) — морфологическое аннотирование подкорпу-

сов SYN2000, SYN2005, SYN2006PUB. Я. Паневова и М. Мику-лова (Прага) исследовали категорию взаимности, М. Шевчикова (Прага) — категориальный статус вопросительно-относительных местоимений, Й. Шимандл (Прага) — проблемы парадигматизации числительных, В. Петкевич (Прага) — вопросы автоматического синтаксического анализа, Л. Углиржова (Прага) — предлог как делимитационное средство, П. Бискуп (Лейпциг) — лексикаль-ные и суперлексикальные предлоги и префиксы, Фр. Чермак (Прага) — парадигматические и синтагматические, формальные и функционально-семантические, системные и несистемные аспекты описания кумуляции союзов, С. Чмейркова (Прага) — когнитивное слово myslim в письменном и разговорном тексте.

На материале Пражского зависимостного корпуса строились доклады пражан Э. Бейчека и П. Страняка (аннотирование многословных выражений), М. Микуловой (спецификация значений обстоятельств места, времени, образа действия и т.п.), И. Миров-ского и Я. Паневовой (проблема поиска данных).

В. Цврчек (Прага) представил новый корпусный менеджер «Парадигма», совместимый с большинством операционных систем; З. Гладка (Брно) — корпус личной корреспонденции, распространяемый на 2 CD в качестве приложения к монографии «Cestina v soucasne soukrome korespondenci. Dopisy, e-maily, SMS» (Brno, 2005), фрагмент которого, начиная с 2006 г., доступен зарегистрированным пользователям Чешского национального корпуса через Интернет; М. Гнаткова (Прага) — готовящийся на основе электронных корпусов словарь Карела Чапека; П. Кадерка4 (Прага) — проект DIALOG, в рамках которого на основе многолетних видеозаписей теледебатов готовится аннотированный корпус, в котором текст по желанию пользователя может быть дополнен соответствующим аудио- и видеосопровождением; Я. Климова (Прага) — проект доступной через Сеть базы данных лингвистических источников.

К. Пала и Д. Главачкова (Брно) сообщили о дополнении чешского WordNet^ описанием 30 тыс. словообразовательных гнезд.

Ряд докладов строился на материале Словацкого национального корпуса. Так, выступление М. Ивановой (Прешов) было посвящено корпусному исследованию статических аксиологических предикатов в словацком языке, А. Карчовой (Братислава) — лингвистическому анализу аббревиатур и сокращений в Словацком национальном корпусе, М. Шимковой (Братислава) — морфологическому и синтаксическому (второй доклад — в соавторстве с Р. Габариком и К. Гайдошовой) аннотированию его текстов.

А. Леонтьев5 (Москва) представил опыт построения корпуса, ориентированного на конкретную исследовательскую задачу, Л. Сен-Жермен (Ньюпорт) — корпуса разговорного чешского языка Corpus93 (138 281 токенов).

М. Мала (Прага) описала соответствия чешским так называемым утвердительным вопросам (zjist' ovaci otazka) в параллельном чешско-английском корпусе, М. Свашек (Париж, Прага) — соответствия частицам vzdyt', prece в чешско-французском параллельном корпусе.

К. Мусилова (Оломоуц) говорила об использовании национальных корпусов при сопоставлении чешского и словацкого языков, Г. Равоенс (Гент) — датского и шведского.

Доклад Р. Гурского (Краков) был посвящен проблемам полной парадигмы польского пассива, а А.А. Поликарпова6 (Москва) — типологии текстов и их кластерному анализу.

Ряд докладов был сделан на материале Британского национального корпуса. Так, П. Блоклбанк (Токио) рассмотрел проблемы синтаксической паттернации дополнений, К.А. Карнереро (Гранада) — корпусного изучения непрямого объекта, С. Хёхе (Бохум) — свойств однокоренных со сказуемым существительных-дополнений (cognate-object) типа live a happy life.

Представившая три доклада группа исследователей из Ман-нгейма (М. Конопка, Ж. Кубчак, У.Г. Васснер, Г. Кейбель, М. Ку-питц, Ц. Белица) поделились опытом использования крупнейшего немецкого корпуса DeReKo (Das Deutsche Referenzkorpus), А. Пшепюрковский (Варшава) — корпуса польского языка, подготовленного Институтом компьютерных исследований польской Академии наук.

Живую реакцию и дискуссию вызвало выступление М. Зиковой и М. Дочекала (Брно) о двойной префиксации и чешском языке.

Часть названных выше докладов была представлена в виде постеров.

Учитывая, что тремя неделями ранее Институт Чешского национального корпуса при философском факультете Карлова университета проводил международную конференцию по корпусам разговорной речи, нельзя не отметить, что Прага по-прежнему остается одним из крупнейших европейских и мировых центров корпусных исследований.

На конференции не только были подведены итоги развития корпусной лингвистики за последние годы, но и также были намечены пути дальнейших исследований. По итогам конференции планируется издание научного сборника.

Примечания

1 2nd International Conference Grammar & Corpora 2007 (25—27.9.2007). Abstracts. Liblice: Ustav pro jazyk cesky Akademie ved Ceske republiky, 2007. См. также сайт конференции: http://mam.ujc.cas.cz/grammar/ 2Conference Grammar & Corpora (23—25.11.2005). Abstracts. Praha: Ustav pro jazyk

cesky Akademie ved Ceske republiky, 2005. 3 В настоящее время через Интернет (см. http://ucnk.ff.cuni.cz/) доступны следующие входящие в состав ЧНК подкорпусы:

SYN2000 — около 100 млн словоформ, образован текстами, представляющими основные функциональные стили современного чешского языка. Отбор текстов для SYN2000 осуществлялся на основании социологических данных о чтении книг и периодики гражданами Чешской Республики в последнее десятилетие XX в.: наличие и степень представленности в корпусе конкретных изданий и авторов зависит от их читаемости среднестатистическим чехом, поэтому большую часть материала SYN2000 образуют публицистические тексты (60%), на втором месте находятся специальные тексты — справочники, энциклопедии и т.д. (25%), на третьем — беллетристика (15%). Составители SYN2000 исходят из предположения, что письменный текст не только отражает (прямо или опосредованно) современную автору языковую ситуацию, но и формирует индивидуальную языковую компетенцию читателя, поэтому включают в его состав не только оригинальные, но и некоторые переводные тексты, а также тексты, написанные и изданные до 1990 г., если они пользуются популярностью среди читателей; fsc2000 — образован теми же текстами, что и SYN2000, однако прошедшими редактирование;

SYN2005 — более поздний 100-миллионный аналог SYN2000 с измененным

соотношением художественных, публицистических и специальных текстов

(соответственно 40—33—27%);

pmk — пражский корпус разговорной речи;

bmk — брненский корпус разговорной речи;

orweil и orwell-mte — корпусы, основанные на чешском переводе романа Оруэлла «1984»;

ksk-dopisy — корпус личной корреспонденции (около 2000 писем); 0RAL2006 — миллионный корпус разговорной речи;

DIAKORP — диахронный корпус (около 500 тыс. слов; планируется пополнение), образован чешскими текстами от XIII в. до современности; SYN2006PUB — синхронный нерепрезентативный корпус публицистических текстов (300 млн слов).

Тем самым Чешский национальный корпус входит в число наиболее авторитетных в мире языковых корпусов.

Обслуживающая Чешский национальный корпус программа Bonito предоставляет возможность вести поиск по словоформе, лексеме, грамматической матрице, а

также по любой возможной их комбинации.

4 Содокладчики: Н. Петерек, Я. Климова, З. Свободова, М. Гавлик, Э. Гавлова, П. Кубачкова.

5 Содокладчики: А.Е. Кибрик, М. Брыкина, А. Леонтьева.

6 Содокладчики: О.В. Кукушкина, В.В. Поддубный, О.Г. Шевелёв.

А.И. Изотов

ВЕСТНИК МОСКОВСКОГО УНИВЕРСИТЕТА. СЕР. 9. ФИЛОЛОГИЯ. 2008. № 3

«ОТ королевы Анны ДО королевы виктории»: международная конференция в варшавском университете

В октябре 2007 г. в Варшаве состоялась конференция «От королевы Анны до королевы Виктории», организованная Центром британских исследований Варшавского университета, активно

i Надоели баннеры? Вы всегда можете отключить рекламу.