Научная статья на тему '2015. 01. 005. Максименко О. И. Формализованная лингвистика. - М. : Изд-во Моск. Гос. Обл. Ун-та, 2013. - 190 с'

2015. 01. 005. Максименко О. И. Формализованная лингвистика. - М. : Изд-во Моск. Гос. Обл. Ун-та, 2013. - 190 с Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
311
56
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФОРМАЛИЗОВАННАЯ ЛИНГВИСТИКА / ПРИКЛАДНАЯ ЛИНГВИСТИКА / ФОРМАЛЬНЫЕ МЕТОДЫ / АЛГОРИТМ / КОНТЕНТ-АНАЛИЗ / МОДЕЛИРОВАНИЕ В ЛИНГВИСТИКЕ
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «2015. 01. 005. Максименко О. И. Формализованная лингвистика. - М. : Изд-во Моск. Гос. Обл. Ун-та, 2013. - 190 с»

фическом аспектах. Прогнозировалось, что данные факторы, наряду с официальным статусом этих языков и привилегированным положением их носителей в ЮАР, могут привести к исключительно высокому уровню билингвизма. В настоящее время билингвизм в среде африканеров действительно достиг высокого уровня: эта языковая группа признает важность второго языка, стремится использовать его в разных сферах (за исключением дома и семейного круга) и отличается высоким уровнем владения английским, включая, как правило, письменные формы языка.

В целом данные проведенного исследования, затронувшего, правда, ограниченный в возрастном и территориальном планах круг участников, не свидетельствуют о происходящем сдвиге к английскому в среде носителей языка африкаанс. Однако автор статьи признает, что все же существует опасность утраты этим языком высокостатусных функций, таких как функция языка высшего образования. Кроме того, автор предостерегает против такого направления борьбы за сохранение языка африкаанс, при котором язык связывается исключительно с консервативными формами идеологии и культурным традиционализмом. Отмечается, что именно такой подход имел негативные последствия для гэльского языка после завоевания независимости Ирландской Республикой и в итоге привел к сдвигу в пользу английского.

Е.О. Опарина

ПРИКЛАДНОЕ ЯЗЫКОЗНАНИЕ

2015.01.005. МАКСИМЕНКО О.И. ФОРМАЛИЗОВАННАЯ ЛИНГВИСТИКА. - М.: Изд-во Моск. гос. обл. ун-та, 2013. - 190 с.

Ключевые слова: формализованная лингвистика; прикладная лингвистика; формальные методы; алгоритм; контент-анализ; моделирование в лингвистике.

Максименко Ольга Ивановна - доктор филологических наук, профессор, профессор кафедры теоретической и прикладной лингвистики лингвистического факультета Института лингвистики и межкультурной коммуникации Московского государственного областного университета.

Работа состоит из 12 основных разделов, имеет введение, заключение, включает в себя список литературы.

Во введении сказано, что книга представляет собой систематическое изложение современных формальных методов, используемых в гуманитарных науках и, в особенности, в прикладной лингвистике. В ней описаны оригинальные способы обработки естественного языка, такие как методы квантитативной и корпусной лингвистики, семантические сети, онтологии в лингвистике, способы создания и оценки современных интеллектуальных систем -систем машинного перевода, информационно-поисковых и экспертных систем. Работа предназначена для студентов учреждений высшего профессионального образования, широкого круга студентов-филологов, а также для тех, кто интересуется проблемами прикладной лингвистики.

Во введении автор подробно объясняет содержание понятия «прикладная лингвистика». Знания разнообразных наук необходимы людям не только для объяснения окружающего мира (свойств, материальных объектов и т.п.), но и для использования их в практической деятельности человека. Существует прикладная математика, прикладная психология, другие направления, занимающиеся решением конкретных прикладных задач. В течение последних десятилетий развивается особое направление и в языкознании - прикладное, которое теперь называют прикладной лингвистикой. Прикладная лингвистика - такая область языкознания, которая отвечает за правильное применение лингвистических данных в решении теоретических и практических проблем в экстралингвистической реальности. Как специальная отрасль исследований, прикладная лингвистика существует уже более 70 лет. Можно выделить ряд направлений в этой науке, главная задача которых заключается в изучении и разработке способов оптимизации функционирования языка. В процессе развития прикладной лингвистики в ней развились такие дисциплины, как квантитативная лингвистика, компьютерная лингвистика, инженерная лингвистика, комбинаторная лингвистика, и другие направления. По мнению автора, наблюдается однако существенный разрыв между растущими возможностями аппаратных средств компьютеров и применяемыми методами решения прикладных задач.

Наиболее освоенные на сегодня методы исследования базируются на хорошо формализованных алгоритмах, полученных в результате построения математических моделей предметных областей. Однако в практической деятельности многие актуальные задачи относятся к типу плохо формализуемых, особенно если дело касается естественного языка, для которого неизвестны аналитические зависимости или действия, приводящие к результату без интеллектуального вмешательства человека. Методы решения плохо формализуемых задач базируются, как правило, на обработке эмпирических данных, накопленных в результате измерений и экспериментов. Соответственно, одной из основных проблем на современном этапе является разработка способов организации хранения информации в базах данных, осуществление выборки и оценки результатов выборки данных о предметных областях в зависимости от решаемой задачи.

В работе подчеркивается, что современное общество называют информационным. Для этого есть серьезные основания: в последние десятилетия резко возросли потоки информации во всех сферах человеческой деятельности и появились мощные технические средства ее передачи и обработки. Однако общение между странами и народами затруднено существованием языковых барьеров. Традиционные методы преодоления языковых барьеров - изучение иностранных языков и перевод. Но с ростом экономических, политических и культурных связей между странами и повышением интенсивности информационных потоков между ними эти методы становятся недостаточными, поэтому продолжают развиваться системы машинного перевода, переводческие накопители и базы знаний поисковых систем, действующие как автономно, так и в среде Интернета. В этом видна серьезная роль и большая заслуга прикладной лингвистики.

Первый раздел исследования - «Формальные методы в современной науке». В нем содержится краткое описание истории и современного состояния как традиционных, так и современных формальных и статистических методов. Представляется очевидным, что ни один конкретный метод не может быть признан универсальным, пригодным для исследования всех аспектов и свойств предмета исследования, из этого делается следующий вывод: чем больше методов применяется для изучения предмета, тем объемнее

и полнее можно получить его характеристику. Следующий раздел -«Квантитативная лингвистика». Он имеет три подраздела: 1) «Дистрибутивно-статистический метод», 2) «Контент-анализ» и 3) «Нечеткая логика в лингвистике».

Термин «квантитативная лингвистика» характеризует междисциплинарное направление в прикладных языковых исследованиях, в котором в качестве основного инструмента изучения языка и речи используются количественные или статистические методы анализа. Эти методы применяются на разных уровнях языкознания: в фонетике, лексикологии, лексикографии, в лингвистике текста и пр. Основными понятиями квантитативной лингвистики являются понятия выборки и генеральной совокупности, а также частоты встречаемости и распределения частот единиц разного уровня в текстах. В том, что касается лексики, основным известным законом является закон Ципфа, он широко применяется при анализе текстов и дает картину распределения частот слов.

Далее в подразделах подробно описываются приемы и методы разных аспектов квантитативного анализа. Дистрибутивно-статистический метод подразделяется на два варианта: дистрибутивный и статистический. Он предполагает использование математического аппарата теории вероятностей и логико-лингвистического аппарата, основанного на понятии дистрибуции, т.е. распределения единиц в тексте. Для успешной реализации дистрибутивно-статистического анализа необходим адекватный и точный выбор единицы анализа и интервала текста, на котором будет проведен анализ. Подробно и с примерами описывается математический аппарат анализа, приводятся формулы и их содержательное значение.

В подразделе «Контент-анализ» описывается содержание этого вида анализа, внутри которого традиционно различают количественный и качественный контент-анализ. Количественный (частотный) контент-анализ проводится на основе стандартизированных процедур подсчета категорий, лингвистических объектов. Количественные показатели, которые характеризуют выбранные категории, имеют решающее значение для формулирования выводов. Например, если нужно проанализировать, насколько велика в исследуемых текстах значимость понятия «мирное урегулирование», и предполагается, что она определяется частотой упоминания

этого понятия в официальных речах руководителей воюющих стран, то после проведения соответствующих арифметических подсчетов встречаемости данного понятия мы получим определенные количественные показатели. Качественный контент-анализ предполагает углубленное содержательное изучение отобранного материала. Например, чтобы сравнить значимость проблемы мирного урегулирования для руководителей воюющих стран, исследователю нужно не только выделить соответствующее понятие в текстах, но и установить, является ли данная проблематика главной среди озвучиваемых автором положений, каковы варианты ее коннотации, эмоциональная окраска и т.д. Качественный контент-анализ может использовать приемы количественного (частотного) контент-анализа.

Третий подраздел - «Нечеткая логика в лингвистике». Нечеткая логика расширяет возможности классической логики, позволяя применять концепцию неопределенности в логических выводах. В отличие от традиционной формальной логики, оперирующей точными и строгими понятиями типа «истина» и «ложь», «да» или «нет», нечеткая логика имеет дело со значениями, лежащими в некотором диапазоне. В работе приводятся математические формулы нечетких множеств и даются примеры их применения.

Третий раздел - «Моделирование в лингвистике». Сегодня моделирование в лингвистических исследованиях признается одним из основных методов изучения языка, но подходы к построению модели в теоретической и прикладной лингвистике различаются. Так, в теоретическом языкознании модель представляет собой идеальный аналог лингвистических объектов. В прикладной лингвистике моделирование напоминает инженерный подход, поскольку построение моделей продиктовано не столько исследовательскими интересами, сколько конкретными практическими потребностями. Но и прикладные лингвистические модели широко используют математический аппарат. К настоящему времени существует обширный корпус лингвистических моделей, описывающих практически все уровни языка: фонетические, морфологические, синтаксические и семантические модели. Детальное описание лингвистических моделей приводится в книгах известных исследователей -Р.Г. Пиотровского, В.З. Демьянкова и многих других.

Следующий раздел исследования - «Искусственные языки». Здесь рассматриваются не только языки типа естественных, пригодные для международного общения (эсперанто, идо и пр.), но и языки профессионального общения в других науках. Появление вычислительной техники предопределило развитие прикладной лингвистики в сторону разработки формального подхода к специализированным языкам типа языков программирования, информационных языков и т.п. Были сформулированы требования к специализированным искусственным языкам с позиции теории алгоритмов.

Одним из современных направлений формализованной лингвистики является корпусная лингвистика, описанию которой посвящен пятый раздел. Целью корпусной лингвистики является формирование корпусов текстов на естественном языке по заданным параметрам. Любой текст рассматривается как реально наблюдаемый текст, созданный в конкретном месте, в конкретное время и конкретным автором. В целом корпусы данных различаются по своей организации и целям, для которых они были созданы. Так, есть исследовательские корпусы, иллюстративные корпусы, динамические и статические корпусы текстов. Корпусы параллельных текстов формируются для практических целей, например для преподавания иностранного языка.

Компьютерному анализу текста посвящен шестой раздел -«Автоматический анализ текста». Компьютерный анализ текстов вобрал в себя достижения нескольких научных подходов. При обработке и анализе текста большое значение имеет показ частоты встречаемости различных классов лексики в словарях-конкордансах, что позволяет точно определить значение конкретных слов и фраз в контексте. Одним из способов демонстрации совместной встречаемости может являться перечень слов с указанием их местонахождения, причем ключевые слова показываются справа или слева от контекста. Данный раздел состоит из двух следующих подразделов: 1) «Методы автоматического индексирования, рубри-цирования и аннотирования» и 2) «Автоматизированное извлечение знаний». В первом подробно показан математический аппарат, позволяющий индексировать тексты с целью извлечения необходимой информации, во втором приводятся примеры объективного получения информации дли образования «знания». Даются ссылки

на современные системы, осуществляющие такие действия, и на современную литературу по предмету. В седьмом разделе - «Автоматическая обработка и понимание текста» - описывается история разработки многих систем семантического анализа текста с целью обеспечить его понимание. В работе подробно анализируются возможности современных систем отечественного и зарубежного происхождения и констатируется, что «понимание» текста компьютером осуществляется в весьма ограниченных пределах.

Восьмой раздел «Семантические сети» продолжает изложение современных представлений о возможностях автоматического семантического анализа. Для успешной реализации алгоритмов понимания смысла предложений на естественном языке с помощью компьютера необходим формальный язык описания смысла предложений. Под формальным языком понимается некоторый набор методов, с помощью которых можно автоматически описывать и обрабатывать смысл естественного языка. Девятый раздел носит название «Онтологии в лингвистике». Под онтологиями в лингвистике понимается артефакт, структура, описывающая значения элементов некоторой структуры. В подразделах этого раздела описываются проекты Микрокосмос, тезаурусы

Русский WordNet, РуТез. В десятом разделе - «Экспертные оценки» - описываются основные методы экспертных оценок, базирующиеся в основном на статистических моделях и математическом подходе.

В двух заключительных разделах работы - десятый раздел «Формальные решения в системах машинного перевода» и одиннадцатый раздел «Формальные решения в информационно-поисковых системах» - описываются общие характеристики систем АСПЕРА, ДИАЛИНГ, модели поиска и эффективность поиска информации в сети Интернет и в ИПС Каскад.

В кратком Заключении говорится, что использование разнообразных формальных методов в современной лингвистике позволяет оптимизировать изучение естественного языка для прикладных и теоретических целей. Список литературы (с. 181-188) содержит библиографию на русском и иностранных языках по рассмотренным в работе темам.

В целом данная работа представляет собой систематическое изложение современных принципов и результатов разработки ме-

тодов анализа и синтеза естественного языка для основных проблем пользования языком и направлена на осуществление целей и задач, сформулированных во введении.

Ю.Н. Марчук

2015.01.006. КУЛЬПИНА В.Г. ОЧЕРКИ ПО ОНОМАСТИЧЕСКОМУ ПЕРЕВОДУ И ЛИНГВОДИДАКТИКЕ. - W-wa: Wyd-wo BEL Studio, 2013. - 160 с. - (Междунар. б-ка журн. «Славянское терми-новедение»; Т. 3 / Гл. ред. Татаринов В. А.). - Библиогр.: с. 153-160.

Ключевые слова: ономастика; лингводидактика; перевод; антропонимы.

В книгу вошли очерки В.Г. Кульпиной, опубликованные в разные годы в виде научных статей и объединенные общей тематикой - польская и русская ономастика, представленная в сопоставлении. В центре внимания исследователя самые распространенные группы ономастической лексики, «релевантные с точки зрения перевода и лингводидактики» (с. 7). Обладая спецификой, ономастические единицы являются частью лексической системы языка и как таковые функционируют на основе ее законов и закономерностей. В.Г. Кульпина при анализе ономастической лексики применяет следующие постулаты: 1) постулат лингвотематического описания групп лексики; 2) постулат культурно-исторической точки отсчета; 3) постулат этнолингвистической отмеченности; 4) постулат структурно-семантических соответствий; 5) постулат соотнесения лексики с языковой нормой; 6) постулат взаимоувязанности ключевых слов и жанровых разновидностей.

Постулат лингво-тематического описания групп лексики подразумевает необходимость описания лексики на основе ее группировки / классификации по тематическим типам слов с акцентом на языковое значение лексических единиц и языковую традицию. Данный постулат позволяет выделить самые разнообразные группы лексики: 1) цветовую, 2) звуковую, 3) количественную, 4) обозначающие природные реалии, реалии крестьянского быта и т.п.

Постулат культурно-исторической точки отсчета означает обращение к историко-культурным, социальным и этносоциолин-гвистическим истокам анализируемой лексики для того, чтобы из-

i Надоели баннеры? Вы всегда можете отключить рекламу.