электронный научный журнал «apriori. cерия: гуманитарные науки»
www.apriori-journal.ru УДК 81
ОТ ТЕОРЕТИЧЕСКОЙ ДО КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ
Смирнова Анастасия Олеговна
магистрант
Санкт-Петербургский государственный университет аэрокосмического приборостроения Санкт-Петербург
Аннотация. В статье рассматриваются прикладные области лингвистики, связанные с автоматизированным подходом к решению задач, стоящих перед лингвистической наукой, а также подчеркиваются отличия прикладной лингвистики от теоретической. Раскрывается роль моделирования как метода исследования в каждой из этих областей. В результате исследования отмечается основное отличие объектов и целей исследований в каждой области.
Ключевые слова: теоретическая лингвистика, прикладная лингвистика, компьютерная лингвистика, моделирование, оптимизация языка.
FROM THEORETICAL TO COMPUTATIONAL LINGUISTICS
Smirnova Anastasiia Olegovna
undergraduate
Saint Petersburg State University of Aerospace Instrumentation
Saint Petersburg
Abstract. Article considers branches of applied linguistics connected with computerized approach to the solution of the problems facing linguistic science. The differences between applied and theoretical linguistics are also noted. In addition, the role of modelling as the research method in each branch are taken into account. In conclusion, article singles out the principal difference between objects and aims of research in each branch.
Key words: theoretical linguistics, applied linguistics, computational linguistics, modelling, language optimization.
1
Современный человек постоянно находится в информационном поле. Он слушает радио, смотрит телевизор, читает газеты, пользуется интернетом. Объемы информации увеличиваются ежегодно, следовательно, происходит развитие и совершенствование средств, передающих информацию. Именно человеческий язык является важнейшим и самым значимым средством не только передачи, но и порождения и хранения информации. Сам по себе язык представляет собой знаковую систему, где каждый знак является средством отражения тех или иных объектов действительности. С помощью языковых средств происходит передача информации, которая, как правило, воплощается в тексте. Язык должен служить одной из главных целей коммуникации - ее успешному осуществлению.
Язык является главным объектом изучения лингвистики. Лингвистика - это наука о языке, о его свойствах и функционировании. Теоретическая лингвистика подразделяется на частную и общую. Общая лингвистика исследует природу языка, его структуру, развитие и т.д., то есть исследует язык как целое [1, с. 400]. Частная лингвистика, в отличие от общей, занимается изучением конкретной языковой ветви. Теоретическая лингвистика описывает функции языка и формирует идею о том, какие свойства являются более значимыми. В противовес теоретической лингвистике, сформировалось такое направление, как «прикладная лингвистика», которое направлено на «реализацию лингвистических знаний с целью решения практических задач» [2, с. 23]. Основное отличие этих двух направлений заключается в том, что теоретическая лингвистика описывает, рассматривает, изучает какие-либо явления языка, которые не всегда имеют практическое применение или наглядное доказательство, а прикладная лингвистика всегда нацелена на практическое применение теоретических обоснований.
Термин «прикладная лингвистика» имеет совершенно разные толкования в нашей стране и за рубежом. В западной лингвистике данный
термин имеет наименования «applied linguistics», «angewandte Linguistik» и обозначает преподавание иностранных языков, а также описание методик преподавания. В работах зарубежных исследователей подход к термину «applied linguistics» постепенно менялся, однако, в центре ее изучения всегда оставались проблемы коммуникации и обучения языку. Со временем объем понятия значительно расширился, включив целый спектр проблем, связанных с языком. В работах Гай Кука (Guy Cook), ученого, занимающегося вопросами прикладной лингвистики, под «прикладной лингвистикой» понимается «научная дисциплина, касающаяся связи науки о языке с принятием решений в реальном мире» («academic discipline concerned with the relation of knowledge about language to decision making in the real world») [3, с. 2]. Другой ученый, Роберт Каплан (Robert Kaplan) описывал «прикладную лингвистику» как «практическую дисциплину, которая переносит проблемы, связанные с языком, в контекст реального мира») («practice-driven discipline that addresses language-based problems in real-world contexts») [4, c. 10]. Таким образом, можно сделать вывод, что прикладная лингвистика выходит далеко за рамки проблем обучения языку.
В СССР данный термин стал употребляться только в 50-е годы прошлого столетия по мере разработки компьютерных технологий, систем информационного поиска и т.д. Вследствие этого, в русскоязычной литературе термины «компьютерная лингвистика», «вычислительная лингвистика» и «инженерная лингвистика» являются синонимами [5, c. 6]. Данный подход представляется некорректным, поскольку каждая из этих областей имеет свой предмет и методы исследования в рамках прикладной лингвистической науки.
В узком понимании, прикладная лингвистика связана с использованием компьютерных технологий для решения лингвистических задач. В английском языке данному термину соответствует термин «computational linguistics». В широком понимании, в центре внимания прикладной линг-
вистики находятся результаты лингвистических исследований, которые представляются необходимыми для решения задач, связанных с обработкой, хранением и передачей информации, обучением языку и т.д. [6, с. 4]. С нашей точки зрения, наиболее обоснованным является определение А.Н. Баранова, представляющее широкий взгляд на данную область: «деятельность по приложению научных знаний об устройстве и функционировании языка в нелингвистических научных дисциплинах и в различных сферах практической деятельности человека...» [5, с. 4]. Кроме того, определение, предложенное А.Н. Барановым дает понять причину характеристики данной отрасли как «прикладной». Таким образом, стоит четко разграничивать понятия «прикладная лингвистика» и «applied linguistics» и понимать, что в зарубежных работах данное понятие оказывается еще шире, чем в работах отечественных ученых, поскольку язык - вокруг нас, следовательно, и прикладная лингвистика касается всего с чем, связан язык. На точку зрения отечественных исследований влияние оказало узкое понимание данного направления, поэтому некоторые авторы до сих пор приравнивают прикладную лингви-
w n w
стику к компьютерной. В настоящее время «под прикладной лингвистикой все чаще понимают все виды автоматической обработки речевой информации», - отмечает В.А. Звегинцев [2, с. 23]. Однако, все же преобладающее количество авторов рассматривает прикладную лингвистику как область довольно широкую по своему обхвату (А.Н. Баранов, К.М. Шилихина, Б.Ю.Городецкий).
Сравнивая теоретическую лингвистику и прикладную, следует отметить сходство одного из методов исследования - моделирования. Моделирование необходимо обычно в тех случаях, когда объект или явление нельзя наблюдать непосредственно. Самым важным в теории моделирования является возможность перенесения особенностей модели на сам объект. Стоит отметить, что моделирование в этих областях отличается друг от друга. Цель моделирования в теоретической лингвистике - это
полноценное описание языковой системы, объяснение наблюдаемых фактов и условий их появления, а также предсказания развития каких-либо аспектов языка. Таким образом, модели в области теоретической лингвистики претендуют исключительно на описание того, как устроен язык. В целом, необходимо выделить главное отличие теоретических и прикладных моделей: теоретическая модель направлена на полноценное описание объекта, а прикладная должна решать конкретные задачи. При этом основной целью методов прикладной лингвистики является оптимизация, то есть такая модель, которая в результате будет отражать только свойства, необходимые для решения конкретной проблемы. В отличие от теоретической лингвистики, прикладная сфера использует выборочный материал, а также больше ориентирована на подъязыки, чем на язык в целом [5, с. 8-11].
Модель может быть любой по своему объему и обхвату материала. Например, стоит отметить, что в рамках когнитивной лингвистики, являющейся разделом общего языкознания, фрейм выступает в качестве самостоятельной модели. Согласно М. Минскому фрейм - «это когнитивная модель, передающая знания и мнения о определенной, часто повторяющейся ситуации». Моделирования концепта отличается тем, что его невозможно представить в виде определенной структуры из-за его отнесенности к области мышления [7, с. 96-97]. Другим, более интересным примером моделирования, является моделирование сюжета в компьютерной лингвистике. Подобное моделирование основывается на трех формализмах представления сюжета: морфологическом, синтаксическом и когнитивном подходе. Данная идея основывается на теории В.Я. Проппа, который выделил общие функции всех персонажей в сказках. К числу базовых функций он отнес: отлучение персонажа сказки из дома, запрет герою на действие, нарушение запрета, обман жертвы вредителем и т.д. Идеи В.Я. Проппа послужили основой создания программы TALE, которая моделирует сюжет сказки на основе последова-
тельности функций персонажей сказки. В программе также учитывается география, локусы, связь между локусами. Подобная модель позволяет не только создать модель мира сказки, но и изучить структуру сюжета и психологию творчества [5, с. 25-26].
Метод моделирования, как один из наиболее распространенных в настоящее время методов в лингвистике, применяется также и в других ее областях, таких как компьютерная лингвистика. Компьютерная лингвистика как отдельное направление появилась в 60-е годы. Компьютерная лингвистика является частью языкознания, поскольку объектом ее изучения является естественный язык и круг ее задач непосредственно связан с языком: моделирование языка, обработка естественного языка, синтез речи и т.д. Центральной проблемой компьютерной лингвистики является моделирование процесса понимания смысла, то есть от текстов на формальном языке к текстам на естественном [8, с. 7]. Компьютерная лингвистика связана с применением компьютеров в процессе изучения и решения лингвистических проблем. Данный термин обозначает определенную область применения компьютерных программ и технологий в процессе моделирования языка. В данных моделях язык рассматривается как средство познания. Например, как уже упоминалось ранее, существует программа TALE для моделирования сюжета сказки. Можно отметить также программу «Элиза», созданную Джозефом Вей-ценбаумом, для создания модели общения между человеком и компьютером.
В целом, сфера компьютерной лингвистики охватывает применение компьютеров в любой сфере языкознания. Моделирование языковой системы, как одна из центральных задач компьютерной лингвистики, подразделяется на три сферы: моделирование общения, моделирование структуры сюжета, гипертекстовые технологии представления текста. Наибольший интерес для нас представляет моделирование общения как «обеспечение общения человека с ЭВМ на естественном или ограни-
ченном естественном языке» [5, с. 20]. С развитием технологий стало крайне важно уметь взаимодействовать с компьютером, точно и верно задавать команды и запросы. Часто модели данного типа используются непосредственно для изучения самого процесса общения, выявления ошибок и коммуникативных неудач.
Помимо областей, рассмотренных выше, выделяются и другие прикладные области лингвистики, такие, как математическая, вычислительная и инженерная лингвистика. Следует отметить, что данные понятия не являются синонимами термина «компьютерная лингвистика», как часто это указывается в источниках (Марчук Ю.Н, Баранов А.Н., Пиотровский Р.Г.). Математическая лингвистика использует математический аппарат в лингвистических исследованиях. Математические приемы позволяют более точно исследовать строение языка, а также вопросы построения текстов. Математическая лингвистика тесно соприкасается с инженерной лингвистикой. Инженерную лингвистику часто называют структурно-прикладной или кибернетической лингвистикой. Данная область, как и математическая лингвистика, имеет в качестве предмета ненаблюдаемые лингвистические объекты, именно поэтому многие проблемы рассматриваются на основании воспроизводящей инженерно-лингвистической модели. Она позволяет одновременно воссоздать функционирование лингвистического объекта и, при этом, хотя бы частично воспроизвести этот объект. Примером такой модели могут служить алгоритмы автоматического распознавания смысла, применяемые в системах аннотирования и реферирования, при синтезе речи и т.д. Из этого следует, что инженерная лингвистика - это раздел языкознания, занимающийся теорией и практикой воспроизводящего моделирования [9, с. 8-9].
Вычислительная лингвистика, как следует из названия, подходит к лингвистическим исследованиям на основании вычислений, благодаря чему можно отметить близость данной области с математической линг-
вистикой. С точки зрения Р. Шенка «вычислительная лингвистика - это «проблема наделения машин способностью общаться с человеком на естественном языке. Наш метод состоит в том, чтобы попытаться понять, как люди общаются друг с другом, и исследовать эти процессы» [10]. Таким образом, задачей данной области является разработка систем естественного языка, а также систем, которые способны решать различные задачи, сформулированные на естественном языке.
Подводя итог, следует обратить внимание на то, что рассмотренные отрасли лингвистики необходимо разграничивать, поскольку в центре их внимания находятся разные проблемы: прикладная лингвистика рассматривает широкий спектр проблем, связанных с языком, компьютерная лингвистика делает акцент на применении компьютерных программ для решения лингвистических проблем, математическая и инженерная лингвистика используют, как правило, математический аппарат при исследовании лингвистических явлений, а вычислительная лингвистика, тесно соприкасаясь с математической, исследует язык и текст на основании вычислений.
Прикладная лингвистика не является синонимом терминов «компьютерная лингвистика», «вычислительная лингвистика» или «инженерная лингвистика», хотя в зарубежных исследованиях под термином «computational linguistics» понимаются все эти сферы и в научной литературе не встречаются отдельные термины для каждого из этих направлений. Нужно понимать, что прикладная лингвистика - это не использование компьютерных программ, это решение проблем, связанных с языком, это «приложение» любых знаний и технологий для решения практических задач.
В данной статье были рассмотрены основные направления исследований прикладной лингвистики, а также ее отличие от теоретической лингвистики. Был проведен сопоставительный анализ подходов к прикладной лингвистике в нашей стране и за рубежом, выделены главные
отличия и черты сходства. Вместе с тем, стоит отметить, что основным сходством является применение моделирования, который выступает основным средством наглядной демонстрации исследуемых объектов.
Список использованных источников
1. Жеребило Т.В. Словарь лингвистических терминов. Назрань: ООО «Пилигрим», 2010. 486 с.
2. Звегинцев В.А. Теоретическая и прикладная лингвистика. М.: Просвещение, 1967. 338 с.
3. Davies A. From practice to theory. Edinburgh: Edinburgh University Press, 2007. 199 p.
4. Kaplan R. The Oxford Handbook of Applied Linguistics. Oxford: Oxford University Press, 2002. 641 p.
5. Баранов А.Н. Введение в прикладную лингвистику. М.: Эдиториал УРСС, 2001. 360 с.
6. Шилихина К.М. Основы прикладной лингвистики. Воронеж, 2006. 51 с.
7. Ремхе И.Н. Статус модели в лингвистических науках и её реализация в когнитивном моделировании языка // Вестник Челябинского государственного университета. 2007. № 8 (86). С. 89-94.
8. Белоногов Г.Г. Компьютерная лингвистика и перспективные информационные технологии. М.: Русский мир, 2004. 248 с.
9. Пиотровский Р.Г. Инженерная лингвистика и теория языка. Л.: «Наука»,1979. 113 с.
10. Демьянков В.З. Основы теории интерпретации и ее приложения в вычислительной лингвистике // Когнитивные аспекты лексикографии [Электронный ресурс]. Режим доступа: http://www.infolex.ru/index.html (дата обращения: 13.03.2016).