Научная статья на тему 'ЛИНГВОКОГНИТИВНЫЙ ПОДХОД К СОЗДАНИЮ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ ПЕРЕВОДА НА ОСНОВЕ СПЕЦИАЛИЗИРОВАННЫХ ПАРАЛЛЕЛЬНЫХ ТЕРМИНОЛОГИЧЕСКИХ БАЗ ДАННЫХ'

ЛИНГВОКОГНИТИВНЫЙ ПОДХОД К СОЗДАНИЮ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ ПЕРЕВОДА НА ОСНОВЕ СПЕЦИАЛИЗИРОВАННЫХ ПАРАЛЛЕЛЬНЫХ ТЕРМИНОЛОГИЧЕСКИХ БАЗ ДАННЫХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
119
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕРМИНОЛОГИЧЕСКАЯ БАЗА ДАННЫХ / ТРАНСФЕРНАЯ МОДЕЛЬ ТЕХНИЧЕСКОГО ЗНАНИЯ / КОГНИТИВНО-КОММУНИКАТИВНЫЙ ПОДХОД / ЛИНГВИСТИЧЕСКАЯ ОНТОЛОГИЯ / СТРУКТУРНОЕ МОДЕЛИРОВАНИЕ И ФОРМАЛИЗАЦИЯ ЕДИНИЦ ЯЗЫКА И РЕЧИ / ТЕРМИНОЛОГИЧЕСКАЯ И СТАТИСТИЧЕСКАЯ ЛЕКСИКОГРАФИЯ / АВТОМАТИЗИРОВАННЫЙ ПЕРЕВОД

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Потапов В.В.

В обозреваемых работах лингвокогнитивный подход в исследовании автоматизированной системы перевода нацелен на разработку терминологической базы, которая закрепляет ряд жизненно важных навыков обработки специальной информации на иностранном языке. Речь идет об извлечении технических знаний из иноязычного текста, категоризации технических знаний, усвоении технических знаний, усвоении общетехнической и специальной терминологии, управлении технической терминологией, оперировании иноязычной технической терминологией. В результате синтеза методов когнитивной лингвистики и когнитивного терминоведения сформулирован метод онтолого-терминоведческого анализа технического термина. Интегрированный подход позволил обосновать синтез двух основных методов представления технического знания: метода лингвистической онтологии и метода информационно-поискового тезауруса. Микро- и макроструктура терминологической базы данных предметной области «базовое оборудование нефтегазовой отрасли» описаны с позиций лингвокогнитивного моделирования. В рассматриваемых работах представлено лингвистическое обеспечение автоматизированных систем и систем управления базами данных посредством лингвистического описания терминологии в целях создания цифровых терминологических систем и электронных терминологических баз данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ЛИНГВОКОГНИТИВНЫЙ ПОДХОД К СОЗДАНИЮ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ ПЕРЕВОДА НА ОСНОВЕ СПЕЦИАЛИЗИРОВАННЫХ ПАРАЛЛЕЛЬНЫХ ТЕРМИНОЛОГИЧЕСКИХ БАЗ ДАННЫХ»

ПРИКЛАДНОЕ ЯЗЫКОЗНАНИЕ. ПЕРЕВОД, ПЕРЕВОДОВЕДЕНИЕ

УДК: 81'32; 81'33 DOI: 10.31249/ling/2022.02.01

Потапов В.В.1

ЛИНГВОКОГНИТИВНЫЙ ПОДХОД К СОЗДАНИЮ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ ПЕРЕВОДА НА ОСНОВЕ СПЕЦИАЛИЗИРОВАННЫХ ПАРАЛЛЕЛЬНЫХ ТЕРМИНОЛОГИЧЕСКИХ БАЗ ДАННЫХ.

(Обзор)

Московский государственный университет им. М.В. Ломоносова

Аннотация. В обозреваемых работах лингвокогнитив-ный подход в исследовании автоматизированной системы перевода нацелен на разработку терминологической базы, которая закрепляет ряд жизненно важных навыков обработки специальной информации на иностранном языке. Речь идет об извлечении технических знаний из иноязычного текста, категоризации технических знаний, усвоении технических знаний, усвоении общетехнической и специальной терминологии, управлении технической терминологией, оперировании иноязычной технической терминологией. В результате синтеза методов когнитивной лингвистики и когнитивного терминоведения сформулирован метод онто-лого-терминоведческого анализа технического термина. Интегрированный подход позволил обосновать синтез двух основных методов представления технического знания: метода лингвистической онтологии и метода информационно-

1 © Потапов В.В., 2022.

поискового тезауруса. Микро- и макроструктура терминологической базы данных предметной области «базовое оборудование нефтегазовой отрасли» описаны с позиций лингво-когнитивного моделирования. В рассматриваемых работах представлено лингвистическое обеспечение автоматизированных систем и систем управления базами данных посредством лингвистического описания терминологии в целях создания цифровых терминологических систем и электронных терминологических баз данных.

Ключевые слова: терминологическая база данных; трансферная модель технического знания; когнитивно-коммуникативный подход; лингвистическая онтология; структурное моделирование и формализация единиц языка и речи; терминологическая и статистическая лексикография; автоматизированный перевод.

Представленные к реферированию исследовательские работы [Федюченко, 2020 а; Федюченко, 2020 б; Федюченко, 2020 в; Федюченко, 2021] посвящены актуальнейшей проблеме современной прикладной лингвистики. Речь идет о формировании параллельного корпуса данных, соотносящихся в определенной предметной области со знанием русского и английского языков. Передача технических знаний в данном ракурсе является малоизученной областью корпусной лингвистики, как ни парадоксально это звучит. Обычно при использовании параллельного корпуса в целях перевода опираются на базу данных лексического плана. В данном случае в центре внимания исследователя находятся такие направления, как извлечение иноязычных технических знаний из текстов на иностранном языке, категоризация технических знаний, усвоение технических знаний, усвоение общетехнической и специальной терминологии, управление технической терминологией, оперирование иноязычной технической терминологией.

Важным предстает рассмотрение контента терминологической базы данных как информационно-поискового инструмента. Сюда автор включает следующие этапы: описание технических текстов на родном и иностранном языках, собственно перевод, составление соответствующих глоссариев и т.д. Таким образом, автор исходит из когнитивных основ преобразования знания в переводческих целях. Логичным выглядит рассмотрение понятия

Лингвокогнитивный подход к созданию автоматизированной системы перевода ...

«термин» как единицы знания прикладного терминоведения и собственно перевода, а также построение терминологических баз данных и их инструментальное использование. Таким образом, автор опирается на модель «переводчик - языковая личность: знание языка в совокупности с техническими знаниями». В этом плане лингвокогнитивный метод неразрывно связан с когнитивно-коммуникативным методом, а также с экспертным методом при решении поставленных автором задач, которые заключаются в том, чтобы выявить и описать преимущества применения когнитивно-коммуникативного подхода в исследованиях по отраслевой терминологии; разработать и обосновать методику идентификации общетехнического термина в техническом тексте; описать лингвистическую онтологию как метод репрезентации технического знания и определить способы его представления в терминологии; определить и продемонстрировать принципы построения, структуру и функции трансферной модели технического знания; обосновать выбор формата терминологической базы данных для репрезентации структуры трансферной модели; разработать микро- и макроструктуру терминологической базы данных по базовому нефтегазовому оборудованию. Объектом исследования в данном направлении является техническое знание как лингвистический феномен. В качестве предмета исследования автор в своих работах рассматривает моделирование технического знания в процессе межъязыкового технического коммуникационного процесса.

Общая цель данного научного направления определяется автором как построение трансферной модели технического знания в формате терминологических баз данных. В этом смысле реализуется интегрирование онтологических и терминологических принципов в методологию когнитивного терминоведения.

Новым в данных работах предстает реализация принципа исследования технического термина с помощью когнитивно-коммуникативного подхода. Именно в рамках данного подхода автор в анализируемых публикациях разрабатывает метод «онто-лого-терминоведческого анализа».

Таким образом, техническое знание интерпретируется как лингвистический объект, который реализуется через терминологию, располагающуюся по четырем уровням: объект, содержание, характер отражения и уровень познания. Следовательно, техниче-

ское знание неразрывно связано с возможностью лингвокогнитив-ного моделирования. В связи с этим автор активно использует фреймовые структуры трансферной модели технического знания: протофрейм «техническое знание» и четыре фрейма «структурирование технического знания», «применение технического знания», «формирование профессиональной компетентности», «повторное применение технического знания» (перевод). Каждый из фреймов включает определенное число слотов, что отражает законченную ситуацию трансфера технического знания.

Структура терминологических баз данных разработана на основе использования понятий «макроуровень» и «микроуровень». Макроструктура включает систему записей: понятие функции; логико-гносеологический тип понятия; смысловой сегмент текста; визуальный контекст; справочная (энциклопедическая) статья о понятиях, из них - новое, включающее определенное действие и событие; функция базового инструмента; логико-гносеологическая принадлежность. Микроструктура включает шесть типов записи: ключевой термин; лексико-грамматические характеристики ключевого термина; структурные компоненты термина (словосочетания); основное определение термина (дефиниция) со ссылкой на источник; синонимы термина, входящие в гнездо слов; тематическая лексика.

Таким образом, процесс обработки параллельных корпусов, исследуемых автором, включает структурное моделирование и формализацию единиц языка и речи, лингвистическую лексикографию и терминографию, терминологическую и статистическую лексикографию, инженерную лингвистику, автоматизированный перевод, что требует, в свою очередь, использования системы автоматического перевода, автоматизированной информационной системы, системы управления базами данных и т.д.

Автором разработана трансферная модель технического знания на основе интеграции принципов лингвистической онтологии и когнитологии. Визуальный контекст введен в алгоритм баз данных, разработана и внедрена методика построения «действия - события» с включением основных функций смысловых доминант используемого алгоритма. Таким образом, в основу данных авторских работ положен интегрированный подход к описанию технического знания с ориентацией на антропоцентрическую парадигму

Лингвокогнитивный подход к созданию автоматизированной системы перевода .

современной науки в области взаимодействия «человек - машина». Следствием этого процесса является обращение автора к трем способам репрезентации знаний: собственно лингвистическому, информационно-поисковому и терминологическому в формате корпусной лингвистики и трансферной модели технического знания в области современной нефтегазовой технологии мирового уровня. Важным также предстает включение в разрабатываемую автором трансферную модель когнитивного принципа, что, несомненно, позволяет более глубоко и всесторонне подойти к решению задачи разработки трансферной модели технического знания в формате терминологических баз данных.

Рассмотрение любой глубокой и перспективной научной концепции позволяет выявить некоторые детали, которые могли бы помочь еще более глубоко проанализировать исследуемый объект. Желательно, чтобы автор, продолжая исследования в данной области, обратился к таким предметным областям, как: во-первых, исследование в области построения параллельных корпусов применительно к различным языкам мира в той или иной области знаний (тактика и стратегия формирования параллельных корпусов данных в рецензируемых работах практически не затрагивались); во-вторых, разработка трансферной модели технического знания в принципе соответствует начальной стадии разработки автоматизированных экспертных систем, прототипы которых имеются в мировой технической литературе; в-третьих, обращение автора к языковой личности (по Ю.Н. Караулову) абсолютно правомерно при решении поставленной в исследовании задачи. Еще более убедительным было бы обращение к концепции вторичной языковой личности (по И.И. Халеевой), так как решаемая автором основная задача связана прежде всего с процессом формирования когнитивной компетентности.

В заключение хотелось бы еще раз подчеркнуть, что анализируемые работы раскрывают необходимость теоретического обоснования критериев идентификации термина с позиции линг-вокогнитивного подхода и описания универсальных характеристик технического термина. Создание терминологической базы данных направлено на выполнение функции информационно-поискового инструмента в процессе лингвистической обработки технического текста и ориентацию на динамическое и многомерное представле-

ние знаний. Таким образом, осуществляются управление полученными информацией и знаниями и их повторное использование в технической коммуникации. Введенные автором понятия «техническая детализация термина», «стратегия выделения смысловых доминант технического текста», «онтолого-терминоведческий анализ» расширяют понятийно-терминологический аппарат прикладной лингвистики, терминоведения и переводоведения.

Список литературы

Караулов Ю.Н. Русский язык и языковая личность. - Москва : Наука, 1987. -363 с.

Федюченко Л.Г. Визуальный контекст как форма репрезентации технического знания // Филологические науки. Вопросы теории и практики. - Тамбов : Грамота, 2020 а. - Т. 13, вып. 1. - С. 324-329. Федюченко Л.Г.Многокомпонентное терминологическое словосочетание как смысловая доминанта англоязычного технического текста // Филологические науки. Вопросы теории и практики. - Тамбов : Грамота, 2020 б. -Т. 13, вып. 4. - С. 183-186. Федюченко Л.Г. Теория перевода в классической и современной исследовательской парадигме: онтология, методология, аксиология : коллективная монография / Аликина Е.В., Георгиева Н.Ю., Федюченко Л.Г. [и др.] ; под общ. ред. Л.В. Кушниной. - Москва : ФЛИНТА, 2020 в. - С. 192-207. Федюченко Л.Г. Терминологическая база данных как трансферная модель технического знания : автореф. дис. ... д-ра филол. наук. - Тюмень : ТюмГУ, 2021. - 41 с.

Халеева И.И. Основы теории обучения пониманию иноязычной речи. - Москва : Высшая школа, 1989. - 238 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.