ВЕСТНИК ПЕРМСКОГО УНИВЕРСИТЕТА. РОССИЙСКАЯ И ЗАРУБЕЖНАЯ ФИЛОЛОГИЯ
2021. Том 13. Выпуск 2
УДК 37.017.92: 004
doi 10.17072/2073-6681-2021 -2-25-35
РАЗРАБОТКА МЕТОДОЛОГИИ МЕДИАЦИИ ТРАНСДИСКУРСИВНОЙ ПЕРЕДАЧИ ЗНАНИЯ: НА СТЫКЕ КОГНИТИВНОЙ И КОМПЬЮТЕРНОЙ
ЛИНГВИСТИКИ
Екатерина Владимировна Исаева
к. филол. н., зав. кафедрой английского языка профессиональной коммуникации Пермский государственный национальный исследовательский университет
614990, Россия, г. Пермь, ул. Букирева, 15. [email protected] SPIN-код: 4468-9991
ORCID: http://orcid.org/0000-0003-1048-7492 ResearcherID: 0-6777-2015
Статья поступила в редакцию 06.04.2021
Просьба ссылаться на эту статью в русскоязычных источниках следующим образом:
Исаева Е. В. Разработка методологии медиации трансдискурсивной передачи знания: на стыке когнитивной и компьютерной лингвистики // Вестник Пермского университета. Российская и зарубежная филология. 2021. Т. 13, вып. 2. С. 25-35. doi 10.17072/2073-6681-2021-2-25-35 Please cite this article in English as:
Isaeva E. V. Razrabotka metodologii mediatsii transdiskursivnoy peredachi znaniya: na styke kognitivnoy i komp'yu-ternoy lingvistiki [Developing a Methodology for Transdiscursive Knowledge Transfer: at the Intersection of Cognitive and Computational Linguistics]. Vestnik Permskogo universiteta. Rossiyskaya i zarubezhnaya filologiya [Perm University Herald. Russian and Foreign Philology], 2021, vol. 13, issue 2, pp. 25-35. doi 10.17072/2073-6681-2021-2-25-35 (In Russ.)
В эпоху современного информационного общества актуальным становится изучение эффективных способов передачи, получения, обработки и хранения знаний. Особую ценность представляет собой специальное знание, формирующееся в процессе профессиональной деятельности, хранящееся в форме онтологии в сознании индивида и репрезентирующееся в виде языка профессиональной коммуникации, терминологий и терминосистем. При этом возрастает роль междисциплинарного общения и коммуникации специального знания, в ходе которых возникает проблема мисрепрезентации специального знания, вызванная несовпадением онтологий коммуникантов. Решением данной проблемы может стать медиация специального знания при его передаче, позволяющая трансформировать исходящее знание с минимальными информационными потерями и высокой степенью усвоения.
В статье представлены результаты проекта, направленного на решение означенной проблемы. В рамках проекта разработана методология медиации знания и создан программный комплекс, позволяющий автоматизировать процесс выявления потенциально близких предметных областей для выбора эффективных лингвистических средств когнитивной медиации.
Новизна исследования заключается в обращении к средствам интеллектуального анализа данных для реализации онтологического и метафорического моделирования.
Разработанная методология медиации специального знания может быть использована для оптимизации профессиональной коммуникации в различных предметных областях, а также при реализации предметного обучения студентов.
Ключевые слова: медиация знания; мисрепрезентация информации; межотраслевая метафора; метафорическое моделирование; онтологическое моделирование; трансдискурсивная передача знания; пересечение онтологий.
© Исаева Е. В., 2021
Медиация знания как фундаментальная
научная задача
Проект направлен на решение проблемы мис-репрезентации информации, возникающей из-за значительных различий в онтологиях (фоновых знаниях) коммуникантов. В ходе научного (профессионального) взаимодействия эти различия препятствуют формированию аналогичных концептуальных метафор, которые могли бы послужить когнитивной основой для усвоения новых знаний. При этом коммуниканты используют языковые средства, в том числе термины и языковые метафоры, являющиеся малоинформативными и даже вызывающими когнитивный диссонанс у собеседника.
В рамках проекта разработана методология медиации научного знания и создан программный комплекс, позволяющий автоматизировать процесс обработки больших текстовых данных с последующим обучением интеллектуальных систем и моделированием компьютерных онтоло-гий. Последние позволяют решить фундаментальные проблемы когнитивного языкознания, такие как моделирование концептуальных, метафорических и семантических и терминологических систем.
Актуальность проблемы медиации знания
Языкознание - отрасль науки, непосредственно связанная со всеми другими отраслями знания, целью которой является изучение языка в различных формах его существования и сферах реализации.
В эпоху современного информационного общества актуальным становится изучение языка с позиции когнитивной лингвистики - инструмента получения, обработки и хранения знаний. Особую ценность представляет собой специальное знание, формирующееся в процессе профессиональной деятельности (в дискурсе), хранящееся в форме онтологии в сознании индивида и репрезентирующееся в виде языка профессиональной коммуникации.
При этом возрастает роль междисциплинарного (трансдискурсивного) общения, в ходе которого возникает проблема мисрепрезентации научной информации, вызванная несовпадением онтологий коммуникантов. В связи с этим актуальным становится вопрос эффективной коммуникации специального знания.
Коммуникация представляет собой двусторонний процесс передачи и усвоения специализированной информации. При этом проблемы в коммуникации знания могут возникнуть как на этапе передачи, так и на этапе усвоения информации. Для повышения эффективности коммуникации необходимо координировать качество
передачи специального знания на языковом уровне так, чтобы оно органично встраивалось в существующую онтологию реципиента, при этом не теряя своей способности быть частью исходной онтологии. Изучение межотраслевых метафор, выявление общих элементов онтологий различных научных отраслей, на которые следует опираться при осуществлении лингвистического сопровождения научной (профессиональной) коммуникации, послужило основой для разработки методологии медиации специального знания. Автоматизация исследования позволила рассмотреть большой объем данных, обобщить и визуализировать результаты исследования. Таким образом, исследование, выполняемое на стыке лингвистики, информационных компьютерных технологий и специализированных предметных областей, представляется нам особенно актуальным.
Эволюция проблемы медиации знания
в науке
Изучение принципов профессиональной коммуникации является актуальным аспектом современных исследований в различных предметных областях.
Вопрос об эффективности профессиональной коммуникации не является новым. Первые попытки изучения основного инструмента профессиональной коммуникации - терминологии -предпринимались еще в XVI-XVIII вв.; исследования были направлены на фиксацию терминологии анатомии (А. Везалий, Королевское Общество), химии (А. Л. Лавуазье, К. Л. Бертолле), экономики (И. Бекман), биологии и зоологии.
В конце XIX - начале XX в. начинается деятельность по стандартизации терминологии (IEC, ISO, Nord Term), появляются терминологические теории и практики (например, лексикография языков для специальных целей).
В XX в. изучение языков для специальных целей становится прикладной отраслью лингвистики, важнейший вклад в развитие которой внесли Е. Вюстер, Д. Лотте, А. Реформатский и другие. Внимание к языковым процессам, связи языка и мышления становится толчком для развития когнитивной науки, важнейший вклад в развитие которой внесли такие известные ученые, как Г. Харман, У. Чейф (выявление принципов когнитивной науки), Ч. Филлмор (теория фреймовой семантики), Д. Лакофф и М. Джонсон (теория метафоры и метонимии), Р. Лэнекер (когнитивная грамматика), Э. Рош (теория прототипов). Началом отечественного осмысления когнитивной лингвистики как нового направления исследований стал «Краткий словарь когнитивных терминов», вышедший в свет в Москве
в 1996 г. [Кубрякова 1996]. На базе когнитивной лингвистики формируется когнитивное (гносеологическое) терминоведение, значимую роль в котором играют такие отечественные ученые, как Б. Н. Головин, В. М. Лейчик, Е. С. Кубря-кова и др.
Языкознание XXI в. опирается на теоретические основы предшествующих парадигм, развиваясь в когнитивном направлении и углубляясь в концептуальное содержание термина.
Сегодня в рамках этого направления работают такие известные отечественные лингвисты, как Л. М. Алексеева, Н. Н. Болдырев, Е. И. Голованова, В. З. Демьянков, Л. А. Манерко, С. Л. Миш-ланова, В. Ф. Новодранова, В. Ф. Табанакова и др. Общепризнанным становится положение, что терминология любой области знания или деятельности выступает главным средством хранения, обработки, трансляции и развития концептуальных парадигм в науке: «Центральной проблемой когнитивного терминоведения является проблема соотношения терминосистем... со стоящими за ними структурами специального знания» [Голованова 2013: 13].
Когнитивно-дискурсивное направление тер-миноведения предлагает комплексное изучение терминологии и позволяет рассмотреть терминологические единицы на лингвистическом, концептуальном и прагматическом уровнях. Такой подход к описанию терминологии согласуется с современными тенденциями ведущих европейских и американских лингвистических школ, представленных работами Л. Барсалоу, Г. Буди-на, Р. Гиббса, Т. ван Дейка, Г. Пихта, Г. Стейна, П. Фабер, Я. Энберг и др. Один из когнитивно-дискурсивных методов изучения и упорядочивания системы концептов области специального знания - фреймовая терминология (frame-based terminology; термин, введенный П. Фабер [Faber, Linares, Expósito 2005]) - основывается на предположении, что структура языка отражает концептуальную структуру и что понять суть процесса человеческого мышления возможно, используя язык как зеркало этого процесса [Langacker 1987]. При обращении к фреймовой терминологии специальной области знаний в центре внимания оказывается структура концепта. В ней отражается событийная ситуация, и на ее основе генерируется модель наиболее прототипичных для данной области знаний ситуаций, включающих ссылку на участников событий, их типичные состояния и действия.
В настоящее время появилась тенденция привлекать методы точных наук в исследования в гуманитарной сфере, что привело к распространению идей компьютерной лингвистики, в частности, к появлению корпусных исследований,
статистической обработке лингвистических данных, моделированию онтологий и тезаурусов. Например, с помощью инструментов онтологического компьютерного моделирования были реализованы проекты по разработке лингвистической онтологии «Тезаурус РуТез» [РуТез 2016] и лексической базы данных на английском языке "WordNet" [WordNet 2021]. Неотъемлемой частью компьютерной лингвистики становится разработка национальных корпусов, таких как Национальный корпус русского языка, Британский национальный корпус (BNC), Корпус современного американского языка (COCA), Чешский национальный корпус и другие, которые объединяют в себе различные типы письменных и устных текстов, характерных для данного языка (художественных, публицистических, академических, научных, научно-популярных, деловых, разговорных и т. п.), и предлагают разнообразные варианты текстовой разметки (морфологической, синтаксической, акцентной, семантической и др.).
При поддержке РГНФ (проект № 15-0412015) научным коллективом под руководством К. И. Белоусова разрабатывается Информационная система «Научный центр экспериментальных данных» (база данных и фреймворк экспериментальных лингвистических исследований), предназначенная для извлечения знаний о предметных областях из информационных массивов, включающих текстовые выборки, метаданные, семантические компоненты и семантические поля, частотные, языковые и тезаурусные словари.
В рамках конкурсного проекта (№ 14-06-31143 мол_а) «Тезаурусное моделирование предметной области компьютерной вирусологии с применением нейросетевых технологий для автоматизации разработки онтологий» по гранту РФФИ группа молодых исследователей под руководством Е. В. Исаевой разработала программный комплекс TSBuilder и TSReader, позволяющий оптимизировать способы обработки, систематизации и автоматического обновления терминологической базы конкретной предметной области.
Отметим, что моделирование терминосисте-мы имеет узконаправленный, прикладной характер исследования, что позволяет использовать его как один из рабочих инструментов в более масштабных проектах, целью которых является решение социально значимых вопросов, таких как, например, оптимизация процессов обучения и научной (профессиональной) коммуникации.
Примером тому могут служить работы таких исследователей, как А. Гангеми, М. Стори и Б. Смит, практикующих разработку онтологий для изучения дискурса и профессиональной коммуникации. В частности, Алдо Гангеми (Aldo
Gangemi), профессор Парижского университета Париж 13, занимается решением проблемы множественной интерпретации дискурсивных единиц (полисемией) при передаче знаний. Решение проблемы полисемии он находит в выявлении онтологических схем (шаблонов), которые представляют собой «ситуации», построенные по онтологическому принципу. Таким образом, каждая единица принадлежит и дискурсу, и онтологии. Ограничением данной модели является ее статичный характер, не отражающий процесс коммуникации и только регистрирующий местоположение единицы. Маргарет-Анн Стори (Margaret-Ann Storey), профессор Викторианского университета Канады, исследует когнитивные процессы, поддерживающие совмещение онтологических знаний с их графическим представлением, выявляет оптимальные формы графического представления онтологий. М. Стори решает проблему графического отражения изменения онтологии в результате анализа данных и графической репрезентации эволюции онтологии. В своих работах исследователь косвенно касается вопроса соотношения онтологии и дискурса посредством анализа передачи знаний и онтологии.
Барри Смит (Barry Smith), профессор Университета штата Нью-Йорк, Буффало, США, исследует принципы построения онтологий, холистический подход к построению онтологий и их зависимость от среды (environments) и контекста. Исследователь решает задачи унифицированного описания языковых единиц медицинского дискурса для повышения эффективности профессиональной коммуникации и ее компьютеризированной обработки. В качестве решения проблемы Б. Смит предлагает метод построения онтологии, отражающей все особенности терминологических связей. Недостатком теории, по нашему мнению, является то, что в модели учитываются только философские, но не лингвистические свойства дискурса.
Вопрос о роли метафоры в профессиональной коммуникации также неоднократно поднимался как отечественными лингвистами (Л. М. Алексеевой, Л. А. Манерко, С. Л. Мишлановой, В. Ф. Но-водрановой, А. П. Чудиновым), так и зарубежными (А. Дейнан, Т. Креннмайр, Дж. Лакоффом, Дж. Литтлмор, З. Кевечес, Е. Семино). Метафора при этом рассматривается как «когнитивный механизм, в котором одна понятийная область частично переносится на другую понятийную область, понимаемую через призму первой» [Исаева 2013: 8], репрезентирующийся в виде терминов-метафор на языковом уровне и «совмещенных» ментальных моделей двух различных областей (Источника и Цели) на концептуальном уровне. Когнитивный потенциал метафоры за-
ключается в ее способности моделировать содержание и структуру новых концептов по аналогии с известными концептами.
Стремление автоматизировать лингвистические исследования приводят к разработке «алгоритмизированных» методик изучения метафоры. Так, появились Процедура идентификации метафоры - MIPVU [Pragglejaz Group 2007] и Пяти-шаговый метод моделирования метафоры [Steen 2007], которые представляют собой последовательность правил, регламентирующих действия по выявлению метафор в тексте и моделированию концептуальной метафоры. При этом вопрос автоматизации выявления метафоры до сих пор остается открытым, программное обеспечение для компьютерной идентификации метафоры не разработано, вопрос об автоматизированной медиации (адаптации специального знания) в целях оптимизации профессиональной коммуникации также остается открытым.
Медиация знания: цели и задачи проекта
Опираясь на запрос современного общества в оптимизации передачи и усвоения специального знания, мы поставили перед собой цель разработать методологию медиации специального знания при его трансдискурсивной передаче, т. е. передаче от эксперта к неэксперту.
Для достижения означенной цели были поставлены и решены следующие задачи:
- критический анализ дискурсов ряда предметных областей (компьютерной безопасности, физики, химии, биологии, юриспруденции и др.);
- контент-анализ терминологии представленных выше предметных областей;
- анализ существующих программных средств и переработка/разработка программного комплекса для автоматизированного построения он-тологий предметных областей;
- разработка программного комплекса для выявления пересечения онтологий предметных областей;
- разработка программного комплекса для автоматизированной идентификации межотраслевых метафор;
- определение закономерностей трансформации специального знания при его передаче;
- описание методики трансформации специального знания с минимальными потерями концептуального содержания сообщения в коммуникации типа эксперт - неэксперт.
Научная новизна решения проблемы
медиации знания
Научная новизна проекта заключается в попытке разработать методологию лингвистической медиации специального знания по аналогии
с алгоритмом работы самовосстанавливающегося цифрового Кода Хэмминга, позволяющим контролировать полноту передачи сообщения за счет обнаружения и устранения избыточности и назначения контрольных единиц, дающих возможность выявить ошибки, возникающие при передаче через каналы связи с помехами.
Современным является использование критического дискурсивно-онтологического анализа данных для изучения коммуникации знания и разработки инновационной методики автоматизированной идентификации метафоры в тексте. В когнитивной лингвистике впервые используются средства интеллектуального анализа данных для выявления межотраслевых связей и метафор.
Проект актуален в условиях развития современного информационного общества, в котором особое значение имеют своевременность передачи/получения информации и полнота усвоения специального знания. При этом процесс передачи и усвоения нового специального знания в значительной степени опирается на когнитивный механизм метафоры, заключающийся в познании свойств нового понятия (объекта реальности) через выявление его онтологических свойств (связей) с уже известным понятием (объектом реальности). В связи с этим все больше отечественных и зарубежных ученых-когнитологов стремятся глубже изучить механизм действия метафоры и найти пути ее применения в целях намеренного когнитивного воздействия, например: в обучении - для улучшения запоминания, в литературе - для передачи авторского замысла, в политике - для трансляции идеологии и управления массовым сознанием. В данном ключе наше исследование следует рассматривать как стремление найти пути воздействия на сознание адресата научной (профессиональной) коммуникации в целях повышения степени усвоения передаваемой информации и минимизации искажения при ее передаче.
Пути решения проблемы медиации знания
Основным методом исследования является критический дискурсивно-онтологический анализ данных, включающий в себя лексико-семантический анализ текстов, определение институционального вида и функционального типа дискурса, тезаурусное моделирование, онтологическое моделирование предметной области, соотнесенной с дискурсом.
В рамках данного проекта критический дис-курсивно-онтологический анализ данных предполагает выполнение следующих аналитических действий:
1. Корпусный анализ текстов различных предметных областей. Данный вид работы включает
в себя применение аналитических инструментов электронных корпусов текстов, таких как Корпус современного американского языка (Corpus of Contemporary American English) [COCA 2021], Британский национальный корпус (British National Corpus) [BNC 2021], Национальный корпус русского языка [НКРЯ 2021], для создания конкордансов (электронной коллекции текстов), ка-тегорированных по видам и типам дискурса, выделения ключевых слов для каждого конкорданса, семантического анализа выделенных ключевых слов, определения семантических ролей ключевых слов в контексте (агент, контрагент, объект, инструмент и т. д.) согласно классификации Ч. Филмора [Fillmore 1982].
2. Тезаурусное моделирование терминосисте-мы предметной области. Выполняется на основе идентифицированных ключевых слов, предполагает совместную работу терминологов, лексикографов и экспертов в научных предметных областях по определению терминологического статуса выявленных ключевых слов, классификацию терминов по разделам отраслей знания, определение семантических связей терминов.
На основе полученных контрольных образцов выполняются автоматизированная идентификация терминов в научных (специальных, отраслевых) текстах, автоматизированный семантический анализ и классификация терминологии с использованием программы 'TSBuilder" (свидетельство о государственной регистрации программы для ЭВМ № 2016612898), разработанной коллективом в результате работы по Конкурсу инициативных научных проектов, выполняемых молодыми учеными. РФФИ 01.01.2014 - 31.12.2015 «Тезаурусное моделирование предметной области компьютерной вирусологии с применением нейросетевых технологий для автоматизации разработки онтологий».
3. Интеллектуальный анализ данных (интеллектуальный анализ текстов различных предметных областей, интеллектуальный анализ тезаурусов). В проекте использованы инструменты интеллектуального анализа, незаменимые для обработки большого объема смешанных и гетерогенных данных. Такой вид обработки материала используется для получения информации о речевой (анализ словоупотреблений) и социальной активности пользователя (анализ гиперссылок, графов и социальных сетей), извлечения знаний из текстов (контент анализ текстов), изучения содержания фоновых знаний и ожиданий пользователя (анализ поисковых запросов). В рамках проекта проанализированы тексты, отобранные на этапе корпусного анализа, для выявления их концептуального содержания и
определения семантических связей терминов научной предметной области.
4. Компьютерное моделирование онтологий предметных областей и визуализация их пересечений. По результатам интеллектуального анализа реализовано формализованное описание семантики данных и предметных областей с определением узлов (ключевых понятий, выражаемых терминами) и коннекторов (семантических связей и отношений).
Для решения задачи визуализации пересечения онтологий предметных областей использованы программные средства для выявления совпадающих узлов онтологий различных научных предметных областей, оценка степени родства (совпадения) онтологий, выявление преемственности терминологий этих областей. В данном проекте для построения графа пересечения онто-логий используется библиотека визуализации arbor.js, являющаяся библиотекой языка java script. Термины представляют собой вершины графов, семантические связи - ребра графа. Термины кластеризованы в соответствии с предметной областью, которой они принадлежат. Граф показывает пересечение терминологий и семантические внутриотраслевые (интрадискурсивные) и межотраслевые (интердискурсивные) связи терминов, извлеченные из открытого онлайн-ресурса для разработчиков программного обеспечения Datamuse API [Datamuse 2021]. Сервис Datamuse API построен по принципу корпуса на основе данных Google Books Ngrams и WordNet 3.0, что свидетельствует о репрезентативности и надежности выборки полученных исследовательских данных. Для текущей версии TSGraph был выбран тип семантической связи means-like («похож на»).
5. Концептуальное моделирование онтологии предметной области. Данный этап представляет собой работу эксперта-когнитолога, связанную с лингвистическим описанием данных, полученных на этапе компьютерного моделирования онтологии предметной области. Задачей инженера-когнитолога является интерпретация терминов, организованных в таксономию, их определений, атрибутов, а также связанных с ними аксиом и правил вывода. Метод включает в себя определение ядерных и периферийных областей онтологии научной предметной области, построение концептуальных фреймов, экспертный анализ семантических, логических и лингвистических связей, представление когнитивных моделей.
На основе данных, полученных на этапе компьютерного моделирования онтологий предметных областей и визуализации их пересечений, эксперт-когнитолог делает выводы о роли мета-форизации в познании научной предметной области.
6. Разработка методологии медиации знания. Результаты, полученные на всех этапах проекта, были использованы для описания методологии медиации знания посредством автоматизированного онтологического и метафорического моделирования.
Результаты, полученные в ходе
реализации проекта
Выводы о существовании межотраслевых метафор - терминов сделаны с учетом когнитивно-дискурсивного подхода к изучению терминологии. Данный подход заключается в понимании дискурса как вербально опосредованной профессиональной деятельности, термина как вербальной репрезентации концепта, сформированного в результате профессиональной деятельности человека (назовем их «отраслевые» концепты), терминологии - как совокупности таких вербальных репрезентаций, т. е. как формализованной концептуальной системы, формирующейся в дискурсе, терминосистемы - как онтологии некоторой отрасли, включающей в себя как «отраслевые» концепты, так и системы их отношений/взаимосвязей и зависимостей. Под межотраслевой метафорой мы понимаем феномен перехода термина, обозначающего «отраслевой» концепт одной предметной области (области-источника), в другую (область-цель) для обозначения другого «отраслевого» концепта с сохранением некоторых ключевых, фреймообразующих признаков, позволяющих проводить параллели между этими концептами и домысливать (достраивать фрейм) недостающими элементами, опираясь на фоновые знания из области-источника.
В качестве примера межотраслевой метафоры приведем термин muff (ситуация в американском футболе, когда мяч выпал из рук игрока без вмешательства оппонента, или если было касание мяча без его удержания игроком, который должен был вернуть мяч). Данный термин является весьма информативным для неэксперта в области американского футбола благодаря метафорической основе, апеллирующей к образу человека, движения рук которого ограничены муфтой (muff).
В основе методологии медиации междискурсивной коммуникации лежит критический дис-курсивно-онтологический анализ данных, который включает следующие методы:
1) критический анализ дискурса в контексте нашего проекта понимается как изучение характерных признаков дискурса, понимаемого в дея-тельностном ключе; в центре внимания терминология и «отраслевые» концепты; изучение терминологии ведется на различных уровнях языка и коммуникации (концептуальный, лексический,
семантический, морфологический и др. [Isaeva, Burdina 2019];
2) фреймовый анализ дискурса включает в себя моделирование метафорических и семантических фреймов, а также семантико-синтаксичес-ких фреймов на основе переосмысленной теории валентности и глубинных падежей Ч. Филмора [Isaeva, Crawford 2019];
3) адаптированная теория связи К. Шеннона для понимания механизма передачи знания, осуществляемого по некоторому каналу связи, с учетом фактора потери и изменения этого знания в процессе передачи; метод позволил выявить универсалии, характерные для целого ряда наук, в том числе математики, радиотехники, лингвистики и философии; в данном ключе коммуникация знания представлена как передача и присвоение части онтологии [Isaeva 2019];
4) деривационный и этимологический анализ терминологии [Isaeva 2019];
5) лексикографический анализ терминологии [Исаева 2018б];
6) онтологический подход к терминологии [Манжула 2019];
7) лингводидактические аспекты медиации при обучении иностранному языку для профессиональных целей [Байбурова, Баранова 2019];
8) критический анализ дискурса в аспекте межкультурной коммуникации и миграции, медиация в контексте миграционной лингвистики [Шустова 2019];
9) корпусный анализ терминологии [Исаева 2018а].
Для решения задачи автоматизации идентификации и категоризации межотраслевых метафор были использованы следующие методы:
1. Интеллектуальный анализ данных был реализован с помощью программного комплекса TSBuilder (рис. 1) [ВакЫш, Ьаеуа, Тагагкоу 2020].
Рис. 1. Окно идентификации терминов в программе TSBuilder Fig. 1. Window for the Identification of Terms in TSBuilder
На рис. 1 изображено окно, представляющее результаты работы программы TSBuilder: на заднем плане - панель для ввода текста, подлежащего анализу, на переднем плане - всплывающее окно, в котором отображаются идентифицированные в данном тексте термины с автоматизированной категоризацией.
2. Визуализация онтологий реализована с помощью программного комплекса TSBuilder (рис. 2) для определения семантической близости терминов и установления совпадающих узлов онтологий различных научных предметных областей, оценки степени родства (совпадения) онтологий, выявление преемственности терми-
нологий этих областей [Ьаеуа, ВакШп, Тагаг-коу 2020].
На рис. 2 представлен граф, состоящий из он-тологий 5 предметных областей: геологии, биологии, химии, компьютерной безопасности и юриспруденции. Граф отражает пересечение он-тологий, а также онтологические связи терминов внутри предметных областей (интрадискурсив-ные связи) и межпредметные связи терминов (интердискурсивные связи).
3. В ходе работы над проектом были предприняты первые шаги автоматизации разметки семантических ролей в тексте для специальных целей. Автоматизация семантико-синтаксичес-кого анализа текста реализована на основе систем и приложений открытого доступа, построенных на основе библиотек проекта FгameNet [FгameNet 2021]. Программный продукт находится на стадии апробации. Планируется государственная регистрация программы для ЭВМ.
Рис. 2. Окно визуализации пересечения онтологий в программе TSGraph Fig. 2. Window for Visualization of Ontological Overlapping in TSGraph
Заключение
В статье представлено описание и результаты работы над междисциплинарным проектом «Медиация знания посредством автоматизированного онтологического и метафорического моделирования», реализованным в период 2018-2020 гг. научным коллективом, включившим в себя линг-вистов-когнитологов, экспертов предметных областей и программистов-разработчиков. В связи с этим проведенную работу можно представить как комплекс следующих направлений проектной деятельности:
- лингвистический анализ дискурсов различных предметных областей, в том числе дискурсивный, лексико-семантический анализ текстов на английском языке, моделирование термино-систем предметных областей, морфологический, этимологический и синтаксический анализ терминов;
- экспертный анализ терминологий, включивший в себя дефиниционный и контекстный анализ терминоупотреблений;
- разработка программных инструментов для автоматизации идентификации и категоризации терминов: парсинг и размещение базы данных на сервере в облачном сервисе SimpleCloud.ru; оптимизация этапа предобработки данных; улучшение алгоритма категоризации терминов.
Теоретическая составляющая проекта заключается в систематизации знания об онтологии как когнитивной основе человеческого мировосприятия и становления профессиональной личности. Коммуникация специального знания была рассмотрена сквозь призму теории связи К. Шеннона, что позволило выявить универсалии, характерные для целого ряда наук, в том числе математики, радиотехники, лингвистики и философии. Рассмотрен сам механизм передачи знания
по некоторому каналу связи с учетом фактора потери и изменения этого знания в процессе передачи. Коммуникация знания была представлена как передача и присвоение части онтологии. Метафора в данном контексте понимается как пересечение областей (доменов) онтологий. В зависимости от дискурса, в рамках которого происходит профессиональная коммуникация, один из доменов выходит на первый план, не утрачивая при этом онтологические связи с другими доменами, которые в этом случае выступают в качестве фоновых знаний, участвуют в процессе концептуализации и способствуют более качественному усвоению новых знаний. Было изучено понятие медиации, определены наиболее актуальные направления и проблемные сферы общественной жизни, для которых медиация могла бы быть полезна, выявлены малоизученные ниши в этой медиации (в частности, медиация в межкультурной профессиональной коммуникации), намечены направления медиационной деятельности и сформулированы основные методы лингвистической медиации.
Эмпирический компонент проекта связан c составлением базы данных терминов различных предметных областей и построением онтологий на основе семантической близости терминов. Кроме того, в практической части проекта было представлено этимологическое и морфологическое описание терминов.
Фундаментальность проекта заключается в обобщении полученных теоретических и эмпирических данных и описании инструментария для автоматизации лингвистических исследований.
Список источников
НКРЯ - Национальный корпус русского языка. 2021. URL: https://ruscorpora.ru/new/ (дата обращения: 04.04.2021).
РуТез - Тезаурус русского языка РуТез. 2016. URL: http://www.labinform.ru/pub/ruthes/index.htm (дата обращения: 04.04.2021)
BNC - British National Corpus. 2021. URL: http://www.natcorp.ox.ac.uk/ (дата обращения: 04.04.2021).
COCA - Corpus of Contemporary American English. URL: https://www.english-corpora.org/coca/ (дата обращения: 04.04.2021).
Datamuse - Datamuse API. 2021. URL: http://www.datamuse.com/api/ (дата обращения: 04.04.2021).
FrameNet - FrameNet, 2021. URL: https://frame-net.icsi.berkeley.edu/fndrupal/ (дата обращения: 04.04.2021).
WordNet - Princeton, New Jersey 08544 USA. URL: https://wordnet.princeton.edu/ (дата обращения: 04.04.2021)
Список литературы
Байбурова О. В., Баранова И. А. Терминоси-стемы химической науки в лингводидактическом аспекте // Евразийский гуманитарный журнал. 2019. № 4(2). С. 51-60.
Голованова Е. И. Когнитивное терминоведе-ние: проблематика, инструментарий, направления и перспективы развития // Вестник Челябинского государственного университета. 2013. № 24(315). С. 13-17.
Исаева Е. В. Диахронический аспект терминологизации лексемы virus в английском языке: корпусный анализ // Мир науки, культуры, образования. Филологические науки. 2018а. № 4(71). С.425-427.
Исаева Е. В. Преемственность терминологий на основе семантизации лексемы virus в английском языке // Мир науки, культуры, образования. Филологические науки. 2018б. № 4(71). С.423-425.
Исаева Е. В. Модели метафоры в дискурсе компьютерной безопасности: автореф. дис. ... канд. филол. наук. Пермь, 2013. 19 с.
Кубрякова Е. С. и др. Краткий словарь когнитивных терминов / Е. С. Кубрякова В. З. Демьян-ков, Ю. Г. Панкрац, Л. Г. Лузина; под общ. ред. Е. С. Кубряковой. М.: Филол. ф-т МГУ, 1996. 245 с.
Манжула О. В. Принципы установления связей в лингвистических онтологиях // Евразийский гуманитарный журнал. 2019. № 2. С. 29-34.
Шустова С. В. и др. Миграционная лингвистика в современной научной парадигме: медиа-ционные практики / С. В. Шустова, М. Р. Желту-хина, М. В. Дружинина, Е. О. Зубарева, Е. В. Исаева, В. М. Костева, А. С. Черноусова; науч. ред. А. М. Аматов; Перм. гос. нац. исслед. ун-т. Пермь, 2019. 180 с.
Bakhtin V. V., Isaeva E. V., Tararkov A. V. TSBuilder 2.0: Improving the Identification Accuracy Due to Synonymy // Proceedings of the 2020 IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering, EIConRus 2020. P. 225228. URL: https://ieeexplore.ieee.org/document/903-9207. (дата обращения: 04.04.2021). doi 10.1109/ EIConRus49466.2020.9039207.
Faber P., Linares C. M., Expósito M. V. Framing Terminology: A Process-Oriented Approach // Journal des traducteurs / Translators' Journal. 2005. Vol. 50, № 4. doi 10.7202/019916ar
Fillmore Ch. J. Frame Semantics. // Linguistics in the Morning Calm: Selected Papers from SICOL-1981, by The Linguistic Society of Korea. Seoul, Korea: Hanshin Publishing Company, 1982. P. 111-137.
Isaeva E., Burdina O. Transdiscursive term transformation: The evidence from cognitive discursive research of the term 'virus' // Ignasi Navarro i Fer-
rando (Editor), Current Approaches to Metaphor Analysis in Discourse. Berlin, Boston: De Gruyter 2019. P. 79-110. doi 10.1515/9783110629460-005
Isaeva E. V., Crawford R. Semantic Framing of Computer Viruses: the Study of Semantic Roles' Distribution // Вестник Пермского университета. Российская и зарубежная филология. 2019. Т. 11, вып. 1. С. 5-13. doi 10.17072/2037-66812019-1-5-13
Isaeva E. Metaphor in Terminology: Finding Tools for Efficient Professional Communication // Fachsprache, 2019, 41 (Sp. Issue). P. 65-86. doi 10.24989/fs.v41iS1.1766
Isaeva E., Bakhtin V., Tararkov A. Formal Cross-Domain Ontologization of Human Knowledge // Information Technology and Systems / Proceedings of ICITS 2020. Eds. Alvaro Rocha, Carlos Ferras, Carlos Enrique Montenegro Marin, Victor Hugo Medina Garcia, 2020, Springer, Cham. URL: https://link.springer.com/chapter/10.1007/978-3-030-40690-5_10 (дата обращения: 04.04.2021).
Langaker R. W. Foundations of Cognitive Grammar. Stanford: Stanford University Press, 1987. Vol. 1. Theoretical Prerequisites. 540 p.
Pragglejaz Group. MIP: A method for identifying metaphorically used words in discourse // Metaphor and Symbol. 2007. № 22(1). P. 1-39.
Steen G. Finding Metaphor in Grammar and Ussage. Amsterdam; Philadelphia: John Benjamins Publishing Company, 2007. 425 p.
References
Bayburova O. V., Baranova I. A. Terminosistemy khimicheskoy nauki v lingvodidakticheskom aspekte [Term systems of chemical science in the linguodi-dactic aspect]. Evraziyskiy gumanitarnyy zhurnal [Eurasian Humanitarian Journal], 2019, issue 4(2), pp. 51-60. (In Russ.)
Golovanova E. I. Kognitivnoe terminovedenie: problematika, instrumentarii, napravleniya i per-spektivy razvitiya [Cognitive terminology: Issues, tools, trends and prospects]. Vestnik Chelyabinskogo gosudarstvennogo universiteta [Bulletin of Chelyabinsk State University], 2013, issue 24(315), pp. 1317. (In Russ.)
Isaeva E. V. Diakhronicheskiy aspekt terminolo-gizatsii leksemy virus v angliyskom yazyke: kor-pusnyy analiz [The diachronic aspect of terminolo-gization of the lexeme virus in English: Corpus study]. Mir nauki, kultury, obrazovaniya. Filolo-gicheskie nauki [The World of Science, Culture and Education], 2018a, issue 4(71), pp. 425-427. (In Russ.)
Isaeva E. V. Preemstvennost' terminologii na os-nove semantizatsii leksemy virus v angliyskom yazyke [The continuity of terminologies through the semantization of the lexeme virus in English]. Mir
nauki, kultury, obrazovaniya. Filologicheskie nauki [The World of Science, Culture and Education], 2018b, issue 4(71), pp. 423-425. (In Russ.)
Isaeva E. V. Modeli metafory v diskurse kom-pyuternoy bezopasnosti. Avtoref. diss. ... kand. filol. nauk [Metaphor models in the discourse of computer security. Abstract of Cand. philol. sci. diss.]. Perm, Perm State University Press, 2013. 19 p. (In Russ.)
Kubryakova E. S., Dem'yankov V. Z., Pankrats Yu. G., Luzina L. G. Kratkiy slovar' kognitiv-nykh terminov [Concise Dictionary of Cognitive Terms]. Ed. by E. S. Kubryakova. Moscow, Faculty of Philology of Lomonosov Moscow State University Press, 1996. 245 p. (In Russ.)
Manzhula O. V. Printsipy ustanovleniya svyazey v lingvisticheskikh ontologiyakh [Principles of establishing relations in linguistic ontology]. Evraziyskiy gumanitarnyy zhurnal [Eurasian Humanitarian Journal], 2019, issue 2, pp. 29-34. (In Russ.)
Shustova S. V. et al. Migratsionnaya lingvistika v sovremennoy nauchnoy paradigme: mediatsionnye praktiki: monografiya. [Migration Linguistics in Modern Scientific Paradigm: Mediation Practices: Monograph]. Authors: Shustova S. V., Zheltukhi-na M. R., Druzhinina M. V., Zubareva E. O., Isaeva E. V., Kosteva V. M., Chernousova A. S. Ed. by A. M. Amatov. Perm, Perm State University Press, 2019. 180 p. (In Russ.)
Bakhtin V. V., Isaeva E. V., Tararkov A. V. TSBuil-der 2.0: Improving the identification accuracy due to synonymy. Proceedings of the 2020 IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering, EIConRus 2020, pp. 225228. Available at: https://ieeexplore.ieee.org/docu-ment/9039207 (accessed 04.04.2021). doi 10.1109/ EIConRus49466.2020.9039207. (In Eng.)
Faber P., Linares C. M., Expósito M. V. Framing terminology: A process-oriented approach. Journal des traducteurs. Translators' Journal, 2005, vol. 50, issue 4. doi 10.7202/019916ar (In Eng.)
Fillmore Ch. J. Frame semantics. Linguistics in the Morning Calm: Selected Papers from SICOL-1981, by the Linguistic Society of Korea. Seoul, Korea, Hanshin Publishing Company, 1982, pp. 111137. (In Eng.)
Isaeva E., Burdina O. Transdiscursive term transformation: The evidence from cognitive discursive research of the term 'virus'. Current Approaches to Metaphor Analysis in Discourse. Ed. by Ignasi Navarro i Ferrando. Berlin, Boston, De Gruyter 2019, pp. 79-110. doi https://doi.org/10.1515/9783110629 460-005 (In Eng.)
Isaeva E. V., Crawford R. Semantic framing of computer viruses: The study of semantic roles' distribution. Vestnik Permskogo universiteta. Ros-siyskaya i zarubezhnaya filologiya [Perm University Herald. Russian and Foreign Philology], 2019,
vol. 11, issue 1, pp. 5-13. doi 10.17072/2073-66812019-1-5-13. (In Eng.)
Isaeva E. Metaphor in terminology: Finding tools for efficient professional communication. Fachsprache, 2019, 41 (sp. issue), pp. 65-86. doi 10.24989/ fs.v41iS1.1766 (In Eng.)
Isaeva E., Bakhtin V., Tararkov A. Formal cross-domain ontologization of human knowledge. Information Technology and Systems. Proceedings of ICITS 2020. Ed. by Alvaro Rocha, Carlos Ferrâs, Carlos Enrique Montenegro Marin, Victor Hugo Medina Garcia, 2020, Springer, Cham. Available at:
https://link.springer.com/chapter/10.1007/978-3-030-40690-5_10 (accessed 04.04.2021). (In Eng.)
Langaker R. W. Foundations of Cognitive Grammar. Stanford University Press, 1987, vol. 1 Theoretical Prerequisites. 540 p. (In Eng.)
Pragglejaz Group. MIP: A method for identifying metaphorically used words in discourse. Metaphor and Symbol, 2007, issue 22(1), pp. 1-39. (In Eng.)
Steen G. Finding Metaphor in Grammar and Usage. John Benjamins Publishing Company, 2007. 425 p. (In Eng.)
DEVELOPING A METHODOLOGY FOR TRANSDISCURSIVE KNOWLEDGE TRANSFER: AT THE INTERSECTION OF COGNITIVE AND COMPUTATIONAL LINGUISTICS
Ekaterina V. Isaeva
Head of the Department of English for Special Communication Perm State University
15, Bukireva st., Perm, 614990, Russian Federation. [email protected] SPIN-code: 4468-9991
ORCID: http://orcid.org/0000-0003-1048-7492 ResearcherlD: 0-6777-2015
Submitted 06.04.2021
In the era of modern information society, the study of effective ways of transmitting, receiving, processing, and storing knowledge becomes relevant. Special knowledge, formed in the process of professional activity, stored in the form of ontology in the mind of an individual and represented in the form of the language of professional communication, terminologies, and term systems is of particular value. At the same time, the role of interdisciplinary communication and the communication of special knowledge increases, and the problem of the misrepresentation of special knowledge, caused by the mismatch of communicants' ontologies, arises in the course of this communication. The solution to this problem could be the mediation of special knowledge during its transfer, which allows transforming the outgoing knowledge with minimal information losses and a high degree of assimilation.
This article presents the results of a project aimed at solving this problem of the misrepresentation of special knowledge in the process of interdisciplinary communication. In the framework of the project, the methodology of knowledge mediation was developed, and new software was created to automate the process of term system generation (TSBuilder) and identifying potentially close subject areas for the selection of effective linguistic means of cognitive mediation (TSGraph).
The novelty of the research lies in its interdisciplinary approach to the problem solution and the use of data mining tools for the implementation of ontological and metaphorical modelling.
The developed methodology of special knowledge mediation can be used to optimize professional communication in various subject areas, especially between experts and nonexperts, as well as in the implementation of students' professional learning. The software provided is applicable for both linguistic research and other areas involved in professional communication.
Key words: knowledge mediation; information misrepresentation; interdiscursive metaphor; metaphorical modelling; ontological modelling; transdiscursive knowledge transfer; overlapping ontologies.