Научная статья на тему 'Владислав Митрофанович Андрющенко: к 80-летию ученого'

Владислав Митрофанович Андрющенко: к 80-летию ученого Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY-NC-ND
156
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЛАДИСЛАВ МИТРОФАНОВИЧ АНДРЮЩЕНКО / МАШИННЫЙ ФОНД РУССКОГО ЯЗЫКА / МАШИННЫЙ ПЕРЕВОД / AUTOMATIC TRANSLATION / AUTOMATIZATION IN LINGUISTICS / COMPUTATIONAL LINGUISTICS / HISTORIOGRAPHY OF LINGUISTICS / LINGUISTIC STATISTICS

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Крылов Сергей Александрович, Шайкевич Анатолий Янович

Владислав Митрофанович Андрющенко известен, главным образом, как инициатор широкого проекта «Машинный фонд русского языка», разработанного им в 1980-е гг., но так и не осуществленного в запланированном масштабе. В статье дается описание жизни Андрющенко в контексте эпохи.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Andryushchenko’s Eightieth Birthday

Vladislav M. Andryushchenko is mainly known as the author of an ambitious project of ‘Computer fund of the Russian language’, designed in 1980s, but not yet materialised on full scale. The paper concerns the Andryushchenko’s life in the context of XX century Russia.

Текст научной работы на тему «Владислав Митрофанович Андрющенко: к 80-летию ученого»

С.А. Крылов, А.Я. Шайкевич

Владислав Митрофанович Андрющенко: к 80-летию ученого

Владислав Митрофанович Андрющенко известен, главным образом, как инициатор широкого проекта «Машинный фонд русского языка», разработанного им в 1980-е гг., но так и не осуществленного в запланированном масштабе. В статье дается описание жизни Андрющенко в контексте эпохи.

Ключевые слова: Владислав Митрофанович Андрющенко, Машинный фонд русского языка, машинный перевод.

Владислав Митрофанович Андрющенко родился 20 февраля 1934 г. Путь его к тому, что станет делом жизни, начинался рано. Уже в средней школе он полюбил немецкий язык, а серьезное лингвистическое образование получил в Военном институте иностранных языков (ВИИЯ) — весьма солидном вузе послевоенной Москвы. В середине 1950-х гг. ВИИЯ был расформирован, профессура и студенты перешли в Московский государственный педагогический институт иностранных языков (МГПИИЯ), который В. М. Андрющенко и закончил в 1957 г. (Бывшие «ВИИЯковцы» навсегда сохранили чувство корпоративной взаимовыручки, часто помогавшее им в дальнейшей жизни). В аспирантуре МГПИИЯ наш герой занимался историей немецкого языка (научным руководителем была О.И. Москальская, тоже пришедшая из ВИИЯ), темой диссертации был «Синтаксис Томаса Мюнцера»1. С 1962 г. В.М. Андрющенко преподавал немецкий язык на межфакультетской кафедре МГУ и вел занятия по истории немецого языка со студентами филфака. (Любопытно, что на той же кафедре в то время обретались Б.А. Успенский и О.Г. Ревзина). Казалось бы, начинается обычная научная карьера германиста. Но...

Рубеж 1950-х и 1960-х гг. был временем тесных контактов лингвистов и математиков. Взаимный интерес был очень велик, пер-

В.М. Андрющенко

© Крылов С.А., Шайкевич А.Я., 2014

спективы казались многообещающими, но все же неясными. Одних увлекала идея построить теоретические основания лингвистики, опираясь на математическую логику. Другие связывали свои надежды с общественно значимой задачей машинного перевода. Третьи пытались внедрить статистику в языкознание. Владислав Митрофанович всерьез принялся за математическое самообразование. Он ходил на занятия Ю. А. Шихановича в МГУ, посещал семинары Ю.А. Шрейдера в ВИНИТИ, один из немногих лингвистов он овладел практическим ремеслом программирования. Интерес к задачам сопряжения ЭВМ и лингвистики вызревал и у университетского начальства, но инициатива шла снизу. В 1964 г. была создана межфакультетская лаборатория, чье первоначальное название «Лаборатория структурной типологии языков и лингво-статистики» хорошо отражает тогдашние научные устремления соответственно Б.А. Успенского и В.М. Андрющенко.

Если Б.А. Успенский все больше уходил в теоретическую семиотику, то В.М. Андрющенко как заведующий лабораторией чем дальше, тем больше становился научным организатором, проявив на этом поприще незаурядные таланты. Сейчас (из XXI века) трудно даже представить себе те трудности, с которыми он должен был столкнуться полвека тому назад. Начать с того, что в лаборатории не было своей ЭВМ. Было устройство для считывания информации с перфокарт и возможность арендовать машинное время за пределами МГУ. Сизифовым трудом становится отлаживание программ, когда одна за другой лампы оборудования выходят из строя. Тем не менее, лаборатория набирала силу, вскоре она стала называться «Лабораторией вычислительной лингвистики». Выполняя самые разные задачи университета (вплоть до учета отметок в аттестатах абитуриентов), лаборатория завоевывала доверие начальства. В 1977 г. она переезжает на Ленинские горы и получает собственную ЭВМ «Минск-32». В 1964 г. в ней было четыре сотрудника, теперь под началом Андрющенко было больше сотни человек.2

К этому времени академическая общественность осознала отставание нашей страны в сфере информатизации родного языка. Во Франции, например, зримым доказательством успехов Института французского языка (Нанси) стал Dictionnaire des frequences (1971), построенный на корпусе литературных текстов объемом более 70 млн. словоупотреблений. Позднее этот институт создаст монументальный и образцовый многотомный словарь «Trésor de la langue française». В 1978 г. профессор Новосибирского университета (будущий академик) А.П. Ершов, специалист по технологии программирования, на конференции «Диалог-78» делал доклад, посвященный

диалогу человека с ЭВМ. В нем он произнес важные слова: «Любой прогресс в области построения моделей и алгоритмов останется... академическим упражнением, если не будет решена наиважнейшая задача создания Машинного фонда русского языка. Это фундаментальная проблема, решение которой будет иметь очень большую научную, общекультурную и прикладную ценность». Слово было найдено. Личное знакомство с Ершовым окрылило Андрющенко. В основание будущего фонда стали закладываться первые краеугольные камни. Был оцифрован первый сравнительно небольшой корпус устной речи (Саратовский корпус). Из опытов переноса словарей на машинные носители наибольшее значение имела оцифровка «Грамматического словаря» А.А. Зализняка, быстро разошедшегося по самым разным автоматическим системам, имеющим дело с русскими текстами.

Между тем, над нашим будущим юбиляром сгустились тучи. К этому времени был облегчен выезд из СССР, и некоторые сотрудники лаборатории оказались эмигрантами, что, конечно, вызвало недовольство партийных и других компетентных органов. Скоро нашелся и повод для того, чтобы наказать неугодного заведующего. Издавая в 1982 г. сборник докладов Совместного советско-французского семинара «Актуальные вопросы практической реализации автоматического перевода», В.М. Андрющенко своей властью восстановил ссылки на И.А. Мельчука и В.А. Московича, вычеркнутые было боязливыми редакторами. В ответ на возмущение начальства он просто объяснил, что дал слово авторам докладов оставить их статьи в неизменном виде. Для В.М. Андрющенко понятие чести не пустой звук, у начальства на этот счет другие взгляды. Впрочем, гонители сразу успокоились, когда он ушел с заведования лабораторией.

В.М. Андрющенко нашел сочувствие и поддержку у Ю.Н. Карау-лова, директора Института русского языка Академии наук. В феврале 1983 г. Ершов, Караулов и Андрющенко открывали Всесоюзную конференцию по проблемам создания машинного фонда данных для автоматизированной системы лексикографических исследований. Труды конференции были изданы в 1986 г. под заголовком «Машинный фонд русского языка: идеи и суждения» (19 более или менее пространных докладов и 37 кратких выступлений). Обзорная статья Андрющенко в этом сборнике называлась «Концепция и архитектура машинного фонда русского языка» (это же название имела его докторская диссертация, защищенная в 1986 г., в 1989 г. опубликованная как отдельная книга). В начале статьи автор поименно благодарит тех, кто ответил на вопросник, разосланный перед конференцией (более 30 человек), и добавляет следующее:

«Материалы...» автор обсуждал с А.П. Ершовым, Ю.Н. Карау-ловым, Ю.Д. Апресяном, И.А. Большаковым, А.С. Гердом, О.С. Кулагиной, М.Н. Реммелем, Г.С. Цейтиным, мнение которых оказало наибольшее влияние на формирование точки зрения автора, который стремился в той или иной мере учесть и обобщить все предложения и замечания».

Обратим особое внимание на три черты, проявившиеся в этой работе и характеризующие научную этику, свойственную личности Владислава Митрофановича Андрющенко:

(1) учет мнений разных ученых (причем довольно многих, и при этом принадлежащих к разным учреждениям и коллективам);

(2) проявление человеческой благодарности тем ученым, которые внесли свой вклад в разработку концепции и архитектуры МФРЯ (Машинного фонда русского языка);

(3) эксплицитное указание на авторство идей и предложений, проявившееся при изложении тех или иных мнений.

Теперь перейдем к собственно научной стороне дела.

Концепция и архитектура МФРЯ, разработанная В.М. Андрющенко (на основе интегрирования мнений научного сообщества), является глубоко продуманной и сохраняет свою актуальность спустя тридцать лет после конференции. Согласно этой концепции машинный фонд включает (1.1) иллюстративно-текстовой фонд; (1.2) генеральный словник (аналог Сводного словаря русских словарей Р.П. Рогожниковой); (1.3) автоматический толковый словарь-тезаурус; (1.4) автоматическую документально-фактографическую информационную систему по русистике.

В совокупности эти четыре компонента образуют «информационное обеспечение МФРЯ». «Инструментальное обеспечение МФРЯ» сосредоточено в процессоре русского языка (включающем формальный словарь русского языка, формальную грамматику русского языка, лингвистические алгоритмы анализа и синтеза текста, а также программное обеспечение.

С приходом Горбачева к власти охранительный инстинкт партийных органов стал слабеть, и Караулову наконец удалось полностью перевести Андрющенко в Институт русского языка. Здесь был создан особый отдел машинного фонда, где В.М. Андрющенко стал de facto руководителем компьютерной части, а с 1992 г. и руководителем de jure уже уменьшившегося отдела. Во второй половине 1980-х гг. состоялись еще две конференции по машинному фонду русского языка и других языков СССР. В обзорной статье 1990 г. (Russian Linguistics 14, 171-179) Андрющенко пополняет список

проектируемых компонентов МФРЯ — добавлены Фонетический фонд, Диалектологический фонд, Терминологический фонд. Перечисляются уже сделанные работы — Автоматические варианты Диалектологического атласа русского языка и Синтаксического словаря русского языка Г.А. Золотовой, указывается на расширение текстовых фондов (общественно-политический, фольклорный и т.п.).

В тяжелые 1990-е гг., когда финансирование академии было так нестабильно, многолетняя программа исследований претерпела неизбежные изменения. С одной стороны, перед отделом встала важная техническая задача - переход на персональные компьютеры не только в самом отделе, но и во всем институте. С другой стороны, появление сканеров облегчало создание коллекций литературных текстов, прежде всего, XIX в., где не возникало конфликтов с авторским правом. Машинный фонд русского языка к своим планируемым функциям мог бы добавить еще одну — снабжать пользователей общезначимыми текстами прошлого, стать чем-то вроде Оксфордского архива текстов или Проекта Гутенберга. И на этом новом пути ярко проявилось бескорыстие Владислава Митрофановича. Как только заканчивалась проверка электронных текстов писателя, они тут же выставлялись в Интернете для бесплатного копирования. Эта практика вызывала негодование некоторых коллег-прагматиков, но одновременно способствовала росту коллекций текстов на компакт-дисках вроде замечательной Библиотеки Мошкова.

Проект строительства машинного фонда, детально разработанный В.М. Андрющенко в 1980-е годы, увы — не был осуществлен в полном объеме. Болезни заставили ученого стать пенсионером, но из своего дома он продолжает поддерживать сайт машинного фонда (cfrl.ru), а как исследователь он вернулся к научным увлечениям полувековой давности — к лингвостатистике, для которой только сейчас (при наличии большого корпуса текстов, при современной программной и технической оснащенности) открываются новые перспективы.3

Пожелаем же Владиславу Митрофановичу Андрющенко здоровья и сил для осуществления всего задуманного.

Примечания

1 С ее основными идеями можно познакомиться по статье: Андрющенко В.М. Базисные модели простого и сложного предложений (опыт дескриптивного синтаксиса произведений Томаса Мюнцера) // Вопросы германской и романской филологии. Уч. записки 1-го МГПИИЯ. М., 1963.

Теперь она называется Лабораторией автоматизированных лексикографических систем. Само понятие автоматизированных лексикографических систем было введено в статье: Андрющенко В.М. Автоматизированные лексикографические системы // Теоретические и прикладные аспекты вычислительной лингвистики. М.: Изд-во МГУ, 1981.

Именно В.М. Андрющенко осуществлена подготовка электроных версий трех обширных словарей в кн.: Шайкевич А.Я., Андрющенко В.М., Ребецкая Н.А. Статистический словарь языка Ф.М. Достоевского. М.: Языки славянских культур, 2003; Они же. Статистический словарь языка русской газеты (1990-е годы). Т. 1. М.: Языки славянских культур, 2008; Они же. Дистрибутивно-статистический анализ языка русской прозы 1850 — 1870-х гг. Т. 1. М.: Языки славянских культур, 2013.

2

3

i Надоели баннеры? Вы всегда можете отключить рекламу.