ОБЩИЕ ВОПРОСЫ ФОРМАЛИЗАЦИИ ПРОЕКТИРОВАНИЯ: ОНТОЛОГИЧЕСКИЕ АСПЕКТЫ
УДК 004.8:001 Научная статья DOI: 10.18287/2223-9537-2022-12-3-278-298
Проблемы разработки и развития онтологии науки: анализ классификаций
© 2022, Н.М. Боргест
Самарский национальный исследовательский университет имени академика С.П. Королёва, Самара, Россия
Самарский федеральный исследовательский центр РАН,
Институт проблем управления сложными системами РАН, Самара, Россия
Аннотация
Существующие классификации науки отличаются разнообразием в подходах. Очередная смена номенклатуры научных специальностей, представленная Высшей аттестационной комиссией (ВАК) при Министерстве науки и высшего образования Российской Федерации, и нерешённость проблемы «упрощения процедуры внесения в неё изменений и дополнений» определили актуальность темы, затрагиваемой в статье. Рассмотрены рекомендации ВАК по разработке номенклатуры и паспортов научных специальностей. Отмечены усилия ВАК по сокращению научных специальностей, их обобщению с целью снизить бюрократические преграды при квалификационной оценке соискателей учёных степеней на стыках областей знаний. Рассмотрены количественные результаты научных достижений за последнее десятилетие в форме представленных к защите диссертаций по различным отраслям науки. Доминирование технических и медицинских наук ожидаемо, при этом можно отметить всплеск достижений в экономических и политических науках, который наблюдался особенно в 2013-2018 годы. Научные достижения соискателей в физико-математических, филологических и биологических науках стремятся не отстать от лидеров. Представлен анализ номенклатуры научных специальностей: названий, паспортов, направлений исследований. Проведён частотный анализ терминов, используемых в паспортах научных специальностей, осуществлена количественная оценка заявленных направлений исследований научных специальностей и используемых слов при их описании. Выявлено существенное различие в подходах при описании направлений исследований научных специальностей и значительное количественное отличие. В качестве примера приведён анализ социально-гуманитарной области науки, включающей наибольшее количество отраслей наук. Автор полагает, что разработка онтологии науки может стать тем самым «правовым механизмом» актуализации номенклатуры, который позволит ВАК добиться поставленной цели.
Ключевые слова: системный анализ, классификация науки, номенклатура, научная специальность, направление исследований, онтология.
Цитирование: Боргест Н.М. Проблемы разработки и развития онтологии науки: анализ классификаций // Онтология проектирования. 2022. Т.12, №3(45). С. 278-298. D0I:10.18287/2223-9537-2022-12-3-278-298.
Благодарности: автор выражает искреннюю благодарность своим друзьям и коллегам из Новосибирска за предоставленную возможность провести исследование с помощью программных комплексов Words Finder (программный комплекс для построения терминологических словников, руководитель Ю.А. Загорулько) и KLAN (программный комплекс для создания предметных словарей, руководитель Е.А. Сидорова).
Финансирование: исследование выполнено при финансовой поддержке Министерства науки и высшего образования Российской Федерации, код научной темы FMRW -2022-0030.
Конфликт интересов: автор заявляет об отсутствии конфликта интересов.
80-летию Самарского университета посвящается
Введение
Рассматривая в предыдущей статье онтологию научного направления и онтологию проектирования научного направления, автор затронул вопрос эволюции классификации научного знания [1]. Классификация наук имеет долгую историю [2] и продолжает занимать умы учёных [3, 4]. Существует много подходов к классификации поля научных знаний, созданной техники и разработанных технологий. Классификаторов сотни и «поэтому постоянно нужны переходники, которые позволяют автоматически получить по коду из одного классификатора соответствующие ему коды из другого» [5]. Аналогично поступают и в случае изменения существующих классификаций, когда пытаются сохранить преемственность и связанность прошлых и новых трансформируемых понятий. Например, при смене номенклатуры научных специальностей (НС) Высшей аттестационной комиссией (ВАК) при Министерстве науки и высшего образования Российской Федерации [6] потребовалось подготовить соответствующие рекомендации Президиума ВАК о сопряжении новых и прежних НС [7].
Используемые и разрабатываемые классификаторы, описывающие или стремящиеся описать предметные области (ПрО), как и любые базы данных (БД), учитывают информационные интересы и потребности разработчиков и вбирают в себя их опыт и компетенцию в данных ПрО. Чем шире спектр классифицируемых объектов, чем большее количество ПрО охватывает классификация, тем большее количество специалистов (экспертов) требуется привлекать для её разработки, тем острее стоит вопрос о согласовании понятий и терминов, используемых в различных ПрО, о выравнивании онтологий этих ПрО [8-11]. Об объединении, согласовании и выравнивании онтологий не раз писалось в т.ч. на страницах журнала «Онтология проектирования» (см., например, [12, 13]), а также обсуждалось на онтологических саммитах [14, 15]. Эта тема остаётся в центре внимания разработчиков информационных систем.
Наиболее известными и широко используемыми системами для кодификации знаний в нашей стране являются: универсальная десятичная классификация (УДК, Universal Decimal Classification1); классификатор областей науки, разработанный экспертами Организации экономического сотрудничества и развития (Organisation for Economic Co-operation and Development, OECD) [16]; Государственный рубрикатор научно-технической информации (ГРНТИ)2. Именно последние классификаторы используются в научной электронной библиотекой eLIBRARY.RU для рубрикации размещаемых материалов. Свои классификации имеют широко используемые в мире наукометрические БД Scopus и Web of Science. Для всех наукометрических БД основой для рубрикации размещаемых материалов являются используемые ими классификации.
Эволюция научного знания изменяет представление в том числе о классификации этого знания, что требует внесения изменений в структуру научного знания. Такие изменения - это естественный и необходимый процесс, устанавливающий на определённом временном отрезке вектор развития науки, появление новых, трансформацию уже сложившихся научных дисциплин и направлений. Так, например, в редакцию ГРНТИ 2022 года2 введены важные новые понятия, отражающие развитие науки, техники, отраслей хозяйства и социальной жизни; проведена работа по актуализации и редактированию существующих разделов, устранению дублирования ряда понятий, уточнению и улучшению аппарата ссылок и при-
1 Universal Decimal Classification , UDC. - https://udcsummaryinfo/php/index.php?id=13358&lang=ru.
2 Государственный рубрикатор научно-технической информации. - https://grnti.ru/.
3 РИНЦ (Российский индекс научного цитирования) - ведущая наукометрическая база в Российской Федерации. Онтология проектирования, №3, том 12, 2022
мечаний. Аналогичные изменения с разной периодичностью и в разных масштабах вносятся во все актуальные классификации.
Классификация OECD оказалось, видимо, удачной, т.к. последняя правка была проведена 15 лет назад. Её относительный успех кроется, скорее всего, в отсутствии более детальной классификации, третьего и последующего уровней рубрикации. Построенная на её основе номенклатура НС ВАК детализирует второй уровень, добавляя третий, который и формирует НС.
Классификация науки является не только фактором, организующим познавательную деятельность, но и фактором, который определяет уровень систематизации объектов познания во всех областях науки [17, 18]. Благодаря развитию научной деятельности происходит раскрытие взаимосвязей и взаимопроникновение наук на основании различных принципов. Для понимания принципов классификации науки большое значение имеют способы её представления (схемы, таблицы, графики и др.). Думается, что построение онтологии науки, как согласованного объединяющего семантического графа знаний с соответствующим универсальным для различных пользователей интерфейсом, позволит иметь наглядный развивающийся инструмент рубрикации результатов исследований.
Целью данной во многом постановочной статьи является инициирование работы по созданию онтологии науки с использованием информационных технологий, семантических и лингвистических моделей ПрО НС.
1 Объективные трудности описания эволюционирующего знания
В истории науки известно, как происходило формирование научных дисциплин4. Как из накопленных обобщений и знаний в различных ПрО формировался общий взгляд на мир -начало философии. Как пытливый взгляд человека на звёзды позволил выстроить астрономию, а впоследствии и небесную механику. В поисках возможности объяснить земные явления, не обладая необходимыми для этого знаниями и непрерывно наблюдая за небосклоном, родилась астрология, которая не смогла подтвердить статус научной дисциплины. Причём, что было вначале - астрология или астрономия - на том этапе познания эволюционирующей жизни, уже невозможно определить.
Взгляд философа на практики строительства жилых и общественных зданий позволил ещё до нашей эры дать начало науке архитектуре [19], а очередная попытка построить благостную теорию общественного управления в наше бурное и критическое для цивилизации время рождает эвергетику [20]. Спектр взглядов на окружающие предметы вызывал и вызывает неподдельный интерес, который формировал и продолжает формировать представление о предмете, помогал и помогает выработке гипотез, а впоследствии теорий, из которых создавалось и создаётся то или иное направление в науке. Появление новых направлений не разрывает бесконечную ткань научного знания, а лишь углубляет представление о том предмете, на который обращены взоры исследователей.
Наглядным примером этой растущей ткани знаний может служить взаимосвязь и переплетение НС в новой номенклатуре [6]. На рисунке 1 показаны связи областей5 и отраслей наук . В данной классификации биологические, химические и сельскохозяйственные науки
4 Что касается раннего периода формирования науки, то, скорее всего, есть только предположения (гипотезы), а не фактическое знание.
5 В отличие от классификации [16], послужившей базой для номенклатуры [6], в [6] выделено 5 областей наук, а не 6. Социальные и гуманитарные области науки объединены в одну.
6 В номенклатуре [6] приняты 23 отрасли науки, которые используются для присвоения соискателям учёных степеней, защитивших диссертации по соответствующим НС.
7 Присутствие прикладной сельскохозяйственной науки во всех областях науки трудно объяснимо.
присутствуют во всех пяти областях науки, технические и ветеринарные науки - в четырёх, медицинские, физико-математические и геолого-минералогические - в трёх, шесть отраслей - в двух, 9 отраслей наук - лишь в одной области науки. Количественные иллюстрации принадлежности НС по отраслям и областям науки согласно [6] представлены в [1] на рисунках 1 и 2, в которых показано превалирование количества НС в технических и естественных областях наук. Отраслевой анализ количества НС также показал значительное превосходство технических наук, следом идут физико-математические, медицинские и биологические, отставая от лидера по количеству НС почти в 2.5 раза, а замыкают пятёрку лидеров химические науки.
Рисунок 1 - Взаимосвязи областей и отраслей наук в номенклатуре научных специальностей согласно [6]
При составлении любой классификации важными являются вопросы о сопоставимости объёмов разделяемых областей, о принципах декомпозиции частей, о параметрах разделяемых и выделяемых сущностей [21]. Выделяя НС из областей и отраслей знаний, учитывают многие факторы, важнейшим из которых является инфраструктурное обеспечение, т.е. фактическое наличие организационных структур (институты, лаборатории, кафедры), наличие коллективов учёных, работающих в данном направлении, и научных результатов, полученных в соответствующих ПрО.
На формирование НС, отраслей и областей значительное влияние оказывает уже сложившаяся практика, например, подготовленные диссертационные исследования. В таблице 1 приведены данные о количестве объявлений о защитах диссертаций по отраслям наук за последние 10 лет, размещённые на сайте ВАК8. Из рисунка 2, построенного на основе таблицы 1, видно доминирование технических и медицинских наук. Экономические науки в общем зачёте за 10 лет вышли на третье место, хотя их успех приходится в основном на 2013 -2018 годы, а в последние годы эти науки конкурируют с филологическими науками9.
В период 2013-2018 годы также наблюдался всплеск географических открытий и значимых достижений в политологии и социологии. Вероятно, пандемия повлияла на развитие успеха в этих отраслях науки, и рост новых квалификационных работ замедлился.
Философы в общем зачёте превосходят успехи политологов и социологов, продолжая, с одной стороны, традиции ранней философии, с другой, находясь в поиске приложений к реальной жизни и прикладным наукам. Наблюдается взаимный интерес философов и специалистов, разрабатывающих системы с искусственным интеллектом.
8 Объявления о защитах на сайте ВАК при Минобрнауки РФ. https://vak.mmobmauki.gov.ru/adverts_Hst#tab=_tab:advert~
9 Всё познаётся в сравнении, поэтому автору статьи, как представителю технических наук, радостно за коллег по цеху -экономистов и филологов, и бесспорно, что в отраслях этих наук есть значимые результаты, но хотелось бы видеть, как этот вал научных достижений в экономике и филологии влияет на нашу жизнь.
Таблица 1 - Количество объявлений о защитах диссертаций по отраслям наук в различные периоды
Отрасль науки Количество объявлений о защитах диссертаций на сайте ВАК
2022 2021-2022 2020-2022 2018-2022 2013-2022
Технические науки 1635 3330 4562 8209 23761
Медицинские науки 1178 2804 4184 7502 20111
Филологические науки 556 1012 1349 2548 7207
Экономические науки 548 1026 1433 2519 10505
Физико-математические науки 425 874 1237 2549 8706
Биологические науки 418 888 1261 2271 7301
Юридические науки 343 641 937 1778 5456
Педагогические науки 325 814 1219 2172 7112
Сельскохозяйственные науки 319 567 791 1291 3260
Химические науки 200 479 723 1456 4425
Исторические науки 176 407 589 1202 3811
Искусствоведение 162 249 324 547 1357
Ветеринарные науки 110 200 279 448 1017
Геолого-минералогические науки 96 180 236 414 1187
Психологические науки 80 162 251 484 1807
Культурология 64 135 173 270 670
Философские науки 60 141 219 538 2178
Географические науки 43 98 139 259 837
Фармацевтические науки 41 100 143 278 771
Социологические науки 40 80 110 293 1428
Архитектура 26 43 52 94 232
Политические науки 15 49 69 205 1266
Теология 5 15 17 22 22
Рисунок 2 - Количество объявлений о защитах диссертаций по отраслям наук нарастающим итогом
По количеству представленных за последнее десятилетие квалификационных работ в первые семь отраслей входят также физико-математические, биологические и педагогические науки. Явный аутсайдер в этом отраслевом рейтинге - теология. Являясь по определению разделом культуры, конечно, ей место в культурологии. Без ущерба для науки (напротив, во благо), для оценки квалификационных работ можно было бы также объединить политические науки с социологическими, т.к. наука о власти не может рассматривать методы управления обществом в отрыве от моделей общества. Это подтверждают и количественные результаты представленных работ (см. таблицу 1).
Подобный анализ настоящих и прошлых подготовленных квалификационных работ, в сочетании с анализом научных публикаций по наукометрическим БД, может позволить отслеживать динамику научной деятельности, помочь в формировании номенклатуры НС.
2 Объект и предмет исследования
В статье объектом исследования является классификация знаний, классификация и рубрикация наук. В качестве предмета исследования рассмотрена номенклатура НС ВАК [6].
2.1 Краткая история разработки новой номенклатуры НС ВАК
Начало работ над новой номенклатурой было положено в 2018 году [22]. В Рекомендации [23] ВАК «констатирует, что действующая номенклатура НС во многом не соответствует сложившимся реалиям, что существующая система внесения изменений в номенклатуру НС громоздка и не может оперативно решать поставленные задачи. Рекомендовано использовать классификацию области науки и техники, разработанную Дирекцией науки, технологии и промышленности Комитета по научно-технической политике Организации экономического сотрудничества и развития (ОЭСР)». Структуру новой номенклатуры НС предложено составить из трёх уровней: I - область науки; II - отрасль науки или группы специальностей; III - НС.
На следующем шаге был утверждён проект Ьго и II-го уровней номенклатуры НС [24], но в Приказе [6] в неё были внесены изменения. Например, науки об образовании были заменены на педагогику; химические технологии и технологии материалов - на химические технологии, науки о материалах, металлургия. Не вошли в [6] и военные, военно-технические и специальные науки [24]. Т.е. процесс совершенствования номенклатуры НС шёл и идёт непрерывно.
В рекомендациях [25] был принят проект новой номенклатуры НС, который передан на утверждение в Минобрнауки РФ. При этом рекомендовано «продолжить работу по совершенствованию правового механизма утверждения номенклатуры, обеспечивающего упрощение процедуры внесения в неё изменений и дополнений». Решено также организовать разработку и утверждение паспортов НС. В [26] приведены перечни НС из номенклатур НС, утверждённых приказами Минобрнауки России от 24.02.2021 №118 и от 23.10.2017 № 1027. Сопоставление этих номенклатур показало, что количество НС, не претерпевших изменений (названий и содержаний), составило 213; количество НС, изменивших название, образовавшихся в результате слияния нескольких НС - 47 (было 121); количество НС, названия которых претерпели редакционные изменения - 30. В редакции Приказа [6] от 11.05.2022 года10
10 Приказ Минобрнауки РФ от 11.05.2022 № 445 «О внесении изменений в номенклатуру научных специальностей, по которым присуждаются учёные степени, утверждённую приказом Минобрнауки РФ от 24 февраля 2021 г. № 118, и в соответствие направлений подготовки научно-педагогических кадров в аспирантуре (адъюнктуре) научным специальностям, предусмотренным номенклатурой научных специальностей, по которым присуждаются учёные степени, утверждённой приказом Минобрнауки РФ от 24 февраля 2021 г. № 118, установлен. приказом Минобрнауки РФ от 24 августа 2021 г. №786».
были внесены изменения, которые касались в основном состава отраслей наук (добавление и удаление) по НС, по которым присуждаются учёные степени, а также добавления новых, удаление утративших силу и корректировка названий уже включённых НС. В частности, в НС, по которым аффилирован научный журнал «Онтология проектирования», были внесены дополнения. В НС 2.3.1 добавлено слово «статистика», теперь название 2.3.1. имеет вид «Системный анализ, управление и обработка информации, статистика» (паспорт этой НС пока не опубликован), а в НС 2.5.13. добавлено «испытания и эксплуатация», что позволило в рамках НС исследовать весь жизненный цикл летательных аппаратов, и теперь название НС 2.5.13. «Проектирование, конструкция, производство, испытания и эксплуатация летательных аппаратов».
Важным и во многом определяющим в работе субъектов науки (соискателей, диссертационных и экспертных советов, научных журналов и др.) являются паспорта НС, которые фактически являются контекстом, раскрывающим суть и содержание названия НС. В [27] экспертным советам ВАК для единообразия описания НС было рекомендовано руководствоваться следующими требованиями при подготовке паспортов НС:
■ структура паспорта должна состоять из разделов: а) область науки; б) группа НС;
в) наименование отрасли науки, по которой присуждаются учёные степени; г) шифр и
наименование НС; д) направления исследований; е) смежные специальности;
■ паспорт одной НС должен быть описан в пределах от 1,5 до 6 тыс. знаков11. Ключевыми в паспорте НС, помимо её названия, являются направления исследований (НИ), которые детализируют предмет исследований в НС. В рекомендациях отсутствуют требования по количеству этих направлений и по их детализации.
2.2 Исходные данные для анализа новой номенклатуры НС ВАК
Можно выделить два подхода к подбору корпусов текстовой информации, которые можно использовать для её семантического анализа с целью подготовки основы для разработки тезауруса науки и, в конечном итоге, онтологии науки. Условно эти корпуса научной информации представляют собой «айсберг», разделённый на две неравнозначные части. Основная, «невидимая» его часть - это весь массив научной информации, находящийся в распоряжении наукометрических БД, включая все имеющие фонды библиотек, публикации в материалах научных конференций, журналов, монографий. Обработку этой части научной информации ведут, используя технологии больших данных и работая как с размеченными данными, так и с потоком неструктурированной информации. Меньшую, «видимую» часть айсберга составляет отобранная информация, подготовленная экспертами в конкретных ПрО. В данном анализе в качестве корпуса текстовой информации использовалась «видимая», верифицированная информация, прошедшая строгий экспертный отбор по всем ПрО.
В качестве исходных данных для анализа новой номенклатуры НС использовались но-
12
менклатура НС ВАК [6] и паспорта НС (на 1.09.2022 г. размещено 343 паспорта НС). В качестве примера рассмотрена социально-гуманитарная область науки, включающая наибольшее количество отраслей наук. В таблице 2 приведены НС и их шифры, принятые в номенклатуре НС ВАК в этой области науки.
Представляют интерес следующие вопросы. Как специалисты в различных ПрО в рамках заданных в номенклатуре областей наук и групп специальностей определяют название НС, как описывают и фактически формируют НИ в своих НС? Какое количество терминов по-
11 Введённые ограничения на объём паспорта НС по знакам целесообразно заменить ограничениями на количество слов, как это обычно делается в журналах для рекомендаций авторам при подготовке ими аннотаций статей.
12 Паспорта НС номенклатуры НС. - https://drive.google.com/drive/folders/1RNYkXhvAzaEF85GqxOH8HhbenJIoUMR7.
Таблица 2 - Научные специальности (НС), принятые в номенклатуре НС ВАК, в социально-гуманитарной области науки
ГРУп
па Наименование НС
НС
1.1. Теоретико-исторические правовые науки
о 1.2. Публично-правовые (государственно-
правовые) науки
1.3. Частно-правовые (цивилистические) науки
^ 1.4. Уголовно-правовые науки
1.5. Международно-правовые науки
2.1. Экономическая теория
й 2.2. Математические, статистические и инструментальные методы в экономике
К 2.3. Региональная и отраслевая экономика
Й т 2.4. Финансы
2.5. Мировая экономика
2.6. Менеджмент
3.1. Общая психология, психология личности,
история психологии
3.2. Психофизиология
3.3. Психология труда, инженерная психология,
когнитивная эргономика
3.4. Педагогическая психология, психодиагно-
§ стика цифровых образовательных сред
1'ч о 3.5. Социальная психология, политическая и
о экономическая психология
О м 3.6.1. Клиническая психология (отрасль науки -
медицинские)
3.6.2. Клиническая психология (отрасль науки -
психологические)
3.7. Возрастная психология
3.8. Коррекционная психология и дефектология
3.9. Юридическая психология и психология
безопасности
4.1. Теория, методология и история социологии
1-е 4.2. Экономическая социология
4.3. Демография
н о 4.4. Социальная структура, социальные инсти-
ц туты и процессы
о О 4.5. Политическая социология
4.6. Социология культуры
4.7. Социология управления
§ 5.1. История и теория политики
о 5.2. Политические институты, процессы, техно-
[2 логии
к н 5.3. Государственное управление и отраслевые
С политики
5.4. Международные отношения
■ и а & ^ Р к 6.1. Отечественная история
6.2. Всеобщая история
о и К | 6.3. Археология
6.4. Этнология, антропология и этнография
6.5. Историография, источниковедение, методы исторического исследования
6.6. История науки и техники
6.7. История международных отношений и внешней политики
6.8. Документалистика, документоведение, архивоведение
7. Философия 7.1. Онтология и теория познания
7.2. История философии
7.3. Эстетика
7.4. Этика
7.5. Логика
7.6. Философия науки и техники
7.7. Социальная и политическая философия
7.8. Философская антропология, философия культуры
7.9. Философия религии и религиоведение
8. Педагогика 8.1. Общая педагогика, история педагогики и образования
8.2. Теория и методика обучения и воспитания
8.3. Коррекционная педагогика
8.4. Физическая культура и профессиональная физическая подготовка
8.5. Теория и методика спорта
8.6. Оздоровительная и адаптивная физическая культура
8.7. Методология и технология профессионального образования
9. Филология 9.1. Русская литература и литературы народов Российской Федерации
9.2. Литературы народов мира
9.3. Теория литературы
9.4. Фольклористика
9.5. Русский язык. Языки народов России
9.6. Языки народов зарубежных стран
9.7. Классическая, византийская и новогреческая филология
9.8. Теоретическая, прикладная и сравнительно-сопоставительная лингвистика
9.9. Медиакоммуникации и журналистика
10. Искусствоведение и культурология 10.1. Теория и история культуры, искусства
10.2. Музееведение, консервация и реставрация историко-культурных объектов
10.3. Виды искусства
10.4. Библиотековедение, библиографоведение и книговедение
11. Теология 11.1. Теоретическая теология
11.2. Историческая теология
11.3. Практическая теология
12. Когнитивные науки 12.1. Междисциплинарные исследования когнитивных процессов
12.3. Междисциплинарные исследования мозга
12.3. Междисциплинарные исследования языка
12.4. Когнитивное моделирование
требовалось использовать, чтобы сформулировать название НС, НИ, каким количеством НИ описывается ПрО НС и есть ли (используется) внутренняя их вложенность (декомпозиция уровней)? Какие термины наиболее часто используют специалисты, чтобы описать исследуемые ими сущности в разных областях науки? Возможно, что ответы на эти и другие вопросы позволят выработать требования к построению онтологии науки.
3 Семантический анализ номенклатуры НС ВАК
3.1 Инструменты семантического анализа
Семантический анализ визуальной и текстовой информации давно перестал быть только научным направлением [28-32], а представляет уже огромный рынок с большим количеством потребителей и продавцов. Существуют десятки различных инструментов семантического анализа текста, в т.ч. и бесплатных13, для простых задач могут подойти и офисные программы, функционал которых постоянно совершенствуется.
В данном постановочном исследовании в качестве инструментов применялись разработки коллег из Новосибирска Words Finder (программный комплекс для построения терминологических словников, руководитель Ю.А. Загорулько [30]) и KLAN (программный комплекс для создания предметных словарей, руководитель Е.А. Сидорова [31]), а также семантиче-
13
ский анализ текста Адвего и MS Word.
3.2 Результаты предварительного анализа
Предварительный анализ новой классификации позволяет утверждать о наличии объективных трудностей «разделения» знаний, о различии опыта и взглядов разработчиков на соответствие и отнесение тех или иных результатов в науке в «прокрустово ложе», в жёсткие границы заданной номенклатуры [1]. Тем не менее, эта работа очень важна и нужна науке, и онтология науки с учётом достижений современных информационных технологий может быть тем инструментом, который позволит актуализировать представления о границах научного поиска и взаимосвязи научного знания.
Краткий анализ можно начать с анализа объёма символьного описания НС, в частности анализа количества слов и символов, используемых в названиях НС, анализа количества НИ в НС и объёма символьного описания этих направлений. Сравнительный анализ показал, что количество слов, используемых в названиях НС, отличается на порядок. Т.е. специалисты в разных ПрО формулируют свою НС разным объёмом терминов данной ПрО. Например, наиболее объёмное название НС в технической области науки - «2.9.1. Транспортные и транспортно-технологические системы страны, её регионов и городов, организация производства на транспорте» (13 слов и 108 знаков). Однословных названий НС в номенклатуре несколько десятков, но лидер из них по количеству символов «7.4. Этика» (1 слово и 5 знаков) в социально-гуманитарной области науки (см. таблицу 2). Наиболее объёмное название НС в этой области у НС «3.4. Педагогическая психология, психодиагностика цифровых образовательных сред» (6 слов и 68 знаков). Конечно, определяющими для семантики являются не количество знаков, а слова и стоящие за ними термины и понятия. Одно-двух-трёх слов-ные названия НС чаще всего соответствуют научным направлениям, имеющим устойчивый терминологический аппарат, принятый в данной ПрО, и однозначно понимаемый стоящий за
13 Семантический анализ текста онлайн, seo-анализ текста. https://advego.com/text/seo/. Полный семантический анализ текста. https://miratext.ru/seo_analiz_text. Семантический анализ текста. istio https://istio.com/text/analyz.
ним контекст. Многословие в названии НС характеризует, скорее всего, ещё не сложившееся содержание НС и «кристаллизация» её понятийного и терминологического аппаратов, тезауруса ПрО находятся в процессе.
Зерно, контекст, содержание НС раскрываются в НИ, обозначенных в паспорте НС. Не все экспертные группы, участвующие в их подготовке, справились с требованиями Рекомендации ВАК [27]. Наблюдается существенное отличие в количестве выбранных НИ, а также во вложенности уровней этих НИ. Стоит оговорить, что многоуровневое представление НИ является лишь особенностью конкретной ПрО и отражает взгляд конкретных экспертов на проблемы и задачи, стоящие в данной ПрО.
В таблице 3 представлены НС социально-гуманитарной области науки, в паспортах которых имеются двухуровневые НИ. В этой области науки таких НС оказалось всего восемь. Лидером по количеству вложенности уровней является НС «2.3. Региональная и отраслевая экономика», где 13 первых уровней НИ декомпозируются ещё на 217 НИ. Такая подробная детализация избыточна и связана, скорее всего, с попыткой подтвердить многословием свою целесообразность в номенклатуре НС.
Таблица 3 - НС в социально-гуманитарной области науки, имеющие двухуровневые НИ в паспортах НС
Научные специальности Уровни НИ
Количество НИ на 1-ом уровне Количество НИ на 2-ом уровне
2.3. Региональная и отраслевая экономика 13 217
3.3. Психология труда, инженерная психология, когнитивная эргономика 7 24
10.3. Виды искусства 6 68
3.7. Возрастная психология 3 42
11.3. Практическая теология 3 24
11.1. Теоретическая теология 3 21
11.2. Историческая теология 3 18
3.9. Юридическая психология и психология безопасности 2 13
Эксперты теперь объединённой НС «10.3. Виды искусства» нашли выход сохранить прежние шесть НС, дав каждой из них свои НИ, которые далее декомпозированы на втором уровне в 68 НИ.
В таблице 4 приведены данные о количестве заявленных НИ в социально-гуманитарной области науки в паспортах НС ВАК. Из таблицы видна значительная разница в детальности описания НИ в разных НС. В лидеры по количеству НИ, помимо уже отмеченных в таблице 3 НС «2.3. Региональная и отраслевая экономика» (217 НИ) и «10.3. Виды искусства» (68 НИ), вышли «10.1. Теория и история культуры, искусства» (127 НИ), «7.8. Философская антропология, философия культуры» (81 НИ), «1.1. Теоретико-исторические правовые науки» (68 НИ). В конце этого списка стоят НС, имеющие менее 10 НИ: «3.6.2. Клиническая психология (отрасль науки - психологические, 9 НИ); «3.6.1. Клиническая психология (отрасль науки - медицинские, 9 НИ); «9.4. Фольклористика» (9 НИ) и «9.2. Литературы народов мира» (8 НИ).
В таблице 5 приведены данные о количестве слов, которые использованы при описании НИ в паспортах НС ВАК социально-гуманитарной области науки. Здесь по-прежнему с большим отрывом лидер НС «2.3. Региональная и отраслевая экономика» (2314 слов), за ним НС «3.7. Возрастная психология» (1236 слов), «7.1. Онтология и теория познания» (1045 слов), «10.1. Теория и история культуры, искусства» (997 слов) и «3.9. Юридическая психология и психология безопасности» (901 слово). Замыкают рейтинг по числу используемых
Таблица 4 - Количество заявленных направлений исследований (НИ) в паспортах НС, принятые в номенклатуре специальностей ВАК, в социально- 6.2. Всеобщая история 27
8.4. Физическая культура и профессиональная физическая подготовка 26
гуманитарной области науки 2.5. Мировая экономика 26
Кол-во НИ 9.1. Русская литература и литературы народов 26
Научные специальности Российской Федерации
7.4. Этика 25
2.3. Региональная и отраслевая экономика 217
10.1. Теория и история культуры, искусства 127 11.3. Практическая теология 24
3.3. Психология труда, инженерная психология, когнитивная эргономика 24
7.8. Философская антропология, философия культуры 81
10.3. Виды искусства 68 4.7. Социология управления 23
1.1. Теоретико-исторические правовые науки 68 9.3. Теория литературы 22
7.7. Социальная и политическая философия 63 11.1. Теоретическая теология 21
7.1. Онтология и теория познания 60 6.8. Документалистика, документоведение, архивоведение 21
7.9. Философия религии и религиоведение 46 5.4. Международные отношения 20
7.6. Философия науки и техники 45 4.1. Теория, методология и история социологии 19
3.1. Общая психология, психология личности, история психологии 43 9.7. Классическая, византийская и новогреческая филология 19
4.5. Политическая социология 43 11.2. Историческая теология 18
3.7. Возрастная психология 42 5.3. Государственное управление и отраслевые политики 18
8.1. Общая педагогика, история педагогики и образования 41
2.2. Математические, статистические и инструментальные методы в экономике 18
10.4. Библиотековедение, библиографоведение и книговедение 40
2.1. Экономическая теория 18
10.2. Музееведение, консервация и реставрация историко-культурных объектов 39
8.3. Коррекционная педагогика 17
7.2. История философии 38 3.4. Педагогическая психология, психодиагностика цифровых образовательных сред 16
7.3. Эстетика 36
7.5. Логика 15
6.4. Этнология, антропология и этнография 36 4.3. Демография 15
8.7. Методология и технология профессионального образования 35 9.9. Медиакоммуникации и журналистика 14
3.5. Социальная психология, политическая и экономическая психология 34 3.9. Юридическая психология и психология безопасности 13
8.2. Теория и методика обучения и воспитания 34 12.1. Междисциплинарные исследования когнитивных процессов 12
2.6. Менеджмент 34
9.5. Русский язык. Языки народов России 12
2.4. Финансы 34
1.4. Уголовно-правовые науки 12
5.2. Политические институты, процессы, технологии 33
12.4. Когнитивное моделирование 12
1.3. Частно-правовые (цивилистические) науки 32 12.3. Междисциплинарные исследования языка 12
8.5. Теория и методика спорта 31 9.6. Языки народов зарубежных стран 12
6.3. Археология 31 6.6. История науки и техники 11
1.5. Международно-правовые науки 30 3.8. Коррекционная психология и дефектология 11
1.2. Публично-правовые (государственно-правовые) науки 30 6.7. История международных отношений и внешней политики 11
4.4. Социальная структура, социальные институты и процессы 30 6.5. Историография, источниковедение, методы исторического исследования 10
6.1. Отечественная история 30 3.6.2. Клиническая психология (отрасль науки -психологические) 9
9.8. Теоретическая, прикладная и сравнительно-сопоставительная лингвистика 29
3.6.1. Клиническая психология (отрасль науки -медицинские) 9
4.2. Экономическая социология 29
4.6. Социология культуры 28 9.4. Фольклористика 9
5.1. История и теория политики 28 9.2. Литературы народов мира 8
8.6. Оздоровительная и адаптивная физическая культура 27
Таблица 5 - Количество слов, которые использованы при описании направлений исследований в паспортах НС, принятые в номенклатуре НС ВАК, в социально-гуманитарной области науки
Кол-во слов
Научные специальности
2.3. Региональная и отраслевая экономика 2314
3.7. Возрастная психология 1236
7.1. Онтология и теория познания 1045
10.1. Теория и история культуры, искусства 997
3.9. Юридическая психология и психология 901
безопасности
3.1. Общая психология, психология личности, 896
история психологии
3.6.2. Клиническая психология (отрасль науки - 748
психологические)
11.3. Практическая теология 727
7.7. Социальная и политическая философия 712
10.3. Виды искусства 665
3.5. Социальная психология, политическая и 662
экономическая психология
1.1. Теоретико-исторические правовые науки 566
3.3. Психология труда, инженерная психология, 559
когнитивная эргономика
8.2. Теория и методика обучения и воспитания 547
11.1. Теоретическая теология 526
7.8. Философская антропология, философия 514
культуры
7.6. Философия науки и техники 505
11.2. Историческая теология 502
8.1. Общая педагогика, история педагогики и образования 496
1.3. Частно-правовые (цивилистические) науки 479
2.6. Менеджмент 475
8.6. Оздоровительная и адаптивная физическая 450
культура
7.9. Философия религии и религиоведение 441
8.7. Методология и технология профессиональ- 437
ного образования
4.5. Политическая социология 418
1.5. Международно-правовые науки 414
8.3. Коррекционная педагогика 410
9.3. Теория литературы 397
6.8. Документалистика, документоведение, ар- 393
хивоведение
10.4. Библиотековедение, библиографоведение 388
и книговедение
1.2. Публично-правовые (государственно- 382
правовые) науки
8.4. Физическая культура и профессиональная физическая подготовка 368
9.8. Теоретическая, прикладная и сравнительно- 341
сопоставительная лингвистика
12.1. Междисциплинарные исследования когни- 338
тивных процессов
9.5. Русский язык. Языки народов России 332
4.4. Социальная структура, социальные институты и процессы 329
1.4. Уголовно-правовые науки 325
8.5. Теория и методика спорта 309
10.2. Музееведение, консервация и реставрация историко-культурных объектов 307
5.2. Политические институты, процессы, технологии 303
12.4. Когнитивное моделирование 302
2.4. Финансы 297
12.3. Междисциплинарные исследования языка 281
6.1. Отечественная история 276
7.3. Эстетика 260
4.1. Теория, методология и история социологии 254
9.9. Медиакоммуникации и журналистика 251
5.4. Международные отношения 247
5.3. Государственное управление и отраслевые политики 246
9.6. Языки народов зарубежных стран 243
7.5. Логика 242
9.7. Классическая, византийская и новогреческая филология 231
2.5. Мировая экономика 230
6.2. Всеобщая история 230
7.2. История философии 227
9.1. Русская литература и литературы народов Российской Федерации 217
2.2. Математические, статистические и инструментальные методы в экономике 215
3.4. Педагогическая психология, психодиагностика цифровых образовательных сред 206
4.6. Социология культуры 198
7.4. Этика 193
4.7. Социология управления 192
6.3. Археология 176
6.6. История науки и техники 168
3.8. Коррекционная психология и дефектология 166
6.4. Этнология, антропология и этнография 160
5.1. История и теория политики 157
4.2. Экономическая социология 155
3.6.1. Клиническая психология (отрасль науки -медицинские) 147
9.2. Литературы народов мира 147
2.1. Экономическая теория 138
6.5. Историография, источниковедение, методы исторического исследования 133
4.3. Демография 102
6.7. История международных отношений и внешней политики 85
9.4. Фольклористика 30
слов в описании НИ НС «4.3. Демография» (102 слова), «6.7. История международных отношений и внешней политики» (85 слов) и «9.4. Фольклористика» (30 слов).
Анализ количества использованных слов в НИ при их описании показал также разный подход к представлению этих НИ в разных НС. Например, в НС «10.4 Библиотековедение, библиографоведение и книговедение», в которой содержатся 40 направлений и использовано для описания всех НИ 388 слов, одно из НИ состоит всего из одного слова «Библиофилия». А в НС «3.9 Юридическая психология и психология безопасности», имеющей 13 НИ и описанных 901 словом, одно из НИ составлено из 174 слов14.
13
Сравнение этих двух НИ с использованием Адвего приведено в таблице 6.
Таблица 6 - Статистика минимальных и максимальных по количеству слов текстов НИ в НС социально-гуманитарной области науки «10.4 Библиотековедение, библиографоведение и книговедение» и «3.9 Юридическая психология и психология безопасности»
Значение показателя для НИ в разных НС
Наименование показателя
10.4 «Библиофилия» 3.9 «Психология безопасности»
Количество символов 12 1964
Количество символов без пробелов 11 1790
Количество слов 1 174
Количество уникальных слов 1 71
Количество значимых слов 1 76
Количество стоп-слов 0 27
Вода 0.0 % 56.3 %
Количество грамматических ошибок 0 0
Классическая тошнота документа 1.00 4.00
Академическая тошнота документа 0.0 % 19.5 %
13
Согласно оценочным рекомендациям разработчиков Адвего водность и тошнота текста рассмотренного НИ в НС «3.9 Юридическая психология и психология безопасности» находится в пределах допустимого. При этом высокочастотная часть семантического ядра этого НИ, приведённая в таблице 7, показывает, что при описании лишь одного НИ многократно использовались одни и те же термины, что явно избыточно для краткого описания ПрО.
В качестве примера приведены результаты семантического анализа описания НИ в НС сельскохозяйственной области науки. В таблице 8 приведена статистика этого текста. Отмеченные грамматические ошибки на самом деле таковыми не являются. Они означают лишь буквенные аббревиатуры (АПК, ФАО, ГИС и др.) и использование специфических, узкоспециальных слов, которые не содержит словарь Адвего (сенокосов, севооборот, семеношения и др.). В качестве примера в таблице 9 приводится фрагмент стоп-слов в тексте НИ в НС сельскохозяйственной области науки.
Наибольший интерес представляют термины ПрО, используемые в НИ, и их частотность, т.к. именно они войдут в общую онтологию науки, именно их предстоит согласовывать с другими терминами различных ПрО. В таблице 10 приведён фрагмент высокочастотной части
Таблица 7 - Фрагмент высокочастотной части семантического ядра для НИ в НС «3.9 Юридическая психология и психология безопасности»
Фраза/слово Коли- Частота,
чество %
психологический 16 9.20
безопасность 11 6.32
деятельность 9 5.17
психология 9 5.17
специалист 9 5.17
правореализационный 6 3.45
14 Для наглядности представлен краткий фрагмент этого НИ в данной НС. «Психология безопасности специалистов право-реализационной деятельности в экстремальных условиях деятельности... Психология сохранения жизни и здоровья граждан в изменяющихся социально-политических, экстремальных и опасных условиях жизнедеятельности.»
семантического ядра НИ в НС сельскохозяйственной области науки с использованием Адве-го. Видно, что в данном инструменте семантического анализа текста в семантическое ядро наряду с существительными включают и прилагательные (сельскохозяйственный, биологический, пищевой), характерные для текста данной ПрО.
Таблица 8 - Статистика текста НИ в НС сельскохозяйственной области науки (на основе Адвего)
Наименование показателя Значение
Количество символов 79529
Количество символов без пробелов 70800
Количество слов 8243
Количество уникальных слов 1657
Количество значим х слов 4368
Количество стоп-слов 1605
Вода 47.0 %
Количество грамматических ошибок 111
Класс ческая тошнота док мента 11.27
Академическая тошнота документа 6.0 %
Таблица 9 - Фрагмент стоп-слов в тексте НИ в НС сельскохозяйственной области науки (на основе Адвего)
Слово Количество Частота, %
и 1003 12.17
в 165 2.00
их 80 0.97
для 62 0.7
на 60 0. 3
с 43 0.52
при 27 0.33
к 26 0.32
по 21 0.25
Из таблицы 10 видно, что вершину частотности в сельскохозяйственной области науки наряду с терминами, характерными для этой ПрО (животное, растение, почва, культура и т.п.), занимают общенаучные термины: разработка, метод, технология, система, процесс и др. Аналогичное исследование этих НИ с помощью программного комплекса KLAN выявило прилагательные животный (98) и лесной (42), а также незначительную разность в частоте терминов: метод (120) и животное (98). В таблице 11 приведён фрагмент высокочастотной части словокомплекса (двух-, трёх- и даже четырехсловные термины) НИ в НС сельскохозяйственной области науки, также полученный на основе KLAN.
Используя программный комплекс Words Finder, выполнен аналогичный анализ по всем областям наук. В таблице 12 представлен результат выявления высокочастотных терминов в НИ всех НС номенклатуры ВАК по каждой области науки в отдельности и по всем областям. Сравнение терминов в таблицах 10 и 12 сельскохозяйственной области науки идентично за исключением отмеченных прилагательных в таблице 10. Из таблицы 12 видно, что общенаучные термины в правом столбце формируют основу общенаучного тезауруса. В 15 наиболее частотных терминов всех НИ номенклатуры ВАК попал лишь один узкоспециальный термин - заболевание.
Определение однословных терминов в тексте достаточно просто. Существенно труднее с двух- и трёхсловными терминами (словокомплексами). В таблицах 13 и 14 приведены результаты выявления таких терминов. В таблице 13 приведены фрагменты высокочастотной части словокомплексов НИ в НС по различным областям науки, полученные с использованием программного комплекса KLAN. Приведены словокомплексы в областях наук, которые встречались более 15 раз при описании области науки. Видно, что технические и медицинские области науки в своих описаниях содержат наибольшее количество устойчивых слово-комплексов, что коррелирует с количеством их научных результатов (см. таблицу 1).
Результат выявления высокочастотных одно-, двух- и трёхсловных терминов в НИ НС по всем областям науки, полученный на основе Words Finder, представлен в таблице 14.
Выводы
Проблема классификации науки обусловлена отсутствием целостной онтологии науки, её понятийного аппарата, модели её развития. Представленный анализ номенклатуры науч-
ных специальностей ВАК (названий НС и направлений исследований в паспортах НС) показал существенное различие в подходах при описании направлений исследований научных специальностей и значительное количественное отличие.
Таблица 10 - Фрагмент высокочастотной части семантического ядра НИ в НС сельскохозяйственной области науки (на основе Адвего)
Таблица 11 - Фрагмент высокочастотной части сло-вокомплекса НИ в НС сельскохозяйственной области науки (на основе KLAN)
Фраза/слово Количество Частота,
%
Разработка 127 1.54
Метод 118 1.43
Животное 92 1.12
Технология 92 1.12
Растение 87 1.06
Система 77 0.93
Средство 70 0.85
Почва 65 0.79
Процесс 62 0.75
Использование 61 0.74
Сельскохозяйственный 60 0.73
Биологический 56 0.68
Изучение 54 0.66
Исследование 51 0.62
Культура 48 0.58
Пищевой 48 0.58
Способ 46 0.56
Основа 45 0.55
Различный 45 0.55
Оценка 43 0.52
Продукт 41 0.50
Словокомплекс Кол-во
Лекарственное растение 22
Техническое средство 20
Овощная культура 17
Разработка методов 15
Пищевая система 14
Сельскохозяйственная культура 14
Сельскохозяйственное животное 12
Технологический процесс 12
Инфекционная болезнь 11
Научная основа 11
Агропромышленный комплекс 10
Окружающая среда 10
Охотничье животное 10
Пищевой продукт 10
Болезное животное 9
Защита растений 9
Метод оценки 9
Продукт питания 9
Активное вещество 8
Лесное хозяйство 8
Метод исследования 8
Рациональное использование 8
Таблица 12 - Высокочастотные термины в НИ НС различных областей науки (на основе Words Finder)
Технические Сельскохозяйственные Социально- Все области науки
N Естественные Медицинские гуманитар-
ные
1 Метод Метод Заболевание Разработка Развитие Метод
2 Процесс Система Разработка Метод Метод Разработка
3 Система Разработка Метод Животное Культура Система
4 Разработка Процесс Изучение Технология Исследование Процесс
5 Теория Исследование Система Растение Проблема Исследование
6 Основа Технология Лечение Система Система Технология
7 Исследование Материал Диагностика Средство Деятельность Изучение
8 Изучение Управление Исследование Почва Теория Развитие
9 Структура Основа Профилактика Процесс Процесс Основа
10 Свойство Средство Совершенствование Использование Управление Средство
11 Анализ Обеспечение Развитие Изучение Образование Теория
12 Среда Сооружение Технология Исследование Психология Управление
13 Соединение Объект Средство Культура Наука Среда
14 Создание Производство Пациент Способ Философия Заболевание
15 Моделирование Безопасность Реабилитация Основа Человек Анализ
Таблица 13 - Фрагменты высокочастотной (более 15 повторений при описании области науки) части словокомплексов НИ в НС по различным областям науки (на основе KLAN)
Кол-во Кол-во
Естественные Медицинские
Окружающая среда 18 Метод диагностики 55
Твердое тело 18 Разработка методов 49
Дифференциальное уравнение 17 Изучение этиологии 37
Разработка методов 17 Лекарственное средство 35
Метод исследования 16 Разработка новых 35
Искусственный интеллект 15 Нервная система 34
Научная основа 15 Реабилитация пациентов 24
Физическая основа 15 Метод лечения 23
Технические Реабилитация пациента 23
Разработка методов 89 Клиническая практика 22
Технологический процесс 75 Усовершенствование методов 22
Научная основа 68 Крайний север 19
Летательный аппарат 48 Медицинская помощь 19
Окружающая среда 44 Метод исследования 19
Разработка научных основ 38 Район крайнего севера 19
Экспериментальное исследование 37 Совершенствование методов 18
Жизненный цикл 36 Усовершенствование методов диагностики 18
Метод расчета 36 Изучение механизмов 17
Транспортная система 36 Система крови 17
Чрезвычайная ситуация 35 Совершенствование технологий 17
Экологическая безопасность 34 Лучевая диагностика 16
Система управления 32 Особенность течения 16
Техническое средство 32 Старческий возраст 16
Совершенствование методов 30 Изучение распространенности 15
Информационная технология 29 Лечение заболеваний 15
Исследование процессов 29 Сельскохозяйственные
Теоретическая основа 29 Лекарственное растение 22
Подвижной состав 24 Техническое средство 20
Композиционный материал 22 Овощная культура 17
Математическое моделирование 22 Разработка методов 15
Метод оценки 21 Социально-гуманитарные
Исследование методов 20 Профессиональное образование 36
Метод исследования 20 Психическое развитие 36
Повышение эффективности 20 Международное отношение 27
Горная порода 19 Образовательная среда 23
Строительный материал 18 Историческое развитие 21
Гидротехническое сооружение 17 Государственное управление 20
Метод анализа 17 Искусственный интеллект 20
Научное обоснование 17 Правовое регулирование 19
Энергетическая установка 17 История развития 18
Железная дорога 16 Метод исследования 17
Метода расчета 16 Физическая культура 17
Организация производства 16 Международное право 16
Техническое состояние 16 Развитие человека 16
Автоматизированное проектирование 15 Сфера услуг 16
Информационная безопасность 15 Тенденция развития 16
Информационная система 15 Языковая семья 16
Математическая модель 15 Международное отношенье 15
Обеспечение безопасности 15 Метод анализа 15
Транспортное сооружение 15 Метода исследования 15
Автор полагает, что разработка согласованного тезауруса и, в конечном итоге, онтологии науки позволит создать «правовой механизм» актуализации номенклатуры, необходимый
ВАК для достижения поставленной ею цели. Возможно, что создаваемые порталы знаний и достижения отечественных специалистов в области компьютерной лингвистики [28-33] могли бы послужить основой для создания компьютерной онтологии науки, удобной для коллективного обсуждения и принятия согласованных позиций специалистами-предметниками.
Таблица 14 - Высокочастотные одно-, двух- и трёхсловные термины в НИ НС по всем областям науки (на основе Words Finder)
Однословные термины
N Двухсловные термины Трёхсловные термины
1 Метод Технологический процесс Разработка научных основ
2 Разработка Метод диагностики Система искусственного интеллекта
3 Система Экспериментальные исследования Совершенствование методов диагностики
4 Процесс Твердое тело Периферическая нервная система
5 Исследование Техническое средство Охрана окружающей среды
6 Технология Дифференциальное уравнение Ограниченная возможность здоровья
7 Изучение Физическая основа Новый метод исследования
8 Развитие Психическое развитие Заболевание нервной системы
9 Основа Профессиональное образование Свойство горных пород
10 Средство Лекарственное средство Метод машинного обучения
11 Теория Нервная система Экспериментальный метод исследования
Список источников
[1] Боргест Н.М. Онтология проектирования научного направления: формирование, развитие, примеры. Онтология проектирования. 2022. Т.12, №2(44). С.136-157. DOI:10.18287/2223-9537-2022-12-2-136-157.
[2] Жмудь Л.Я. Две античных классификации наук: Аристотель и Гемин. Schole, СХОЛЭ. 2021. Т.15, №1. С.265-288. DOI:10.25205/1995-4328-2021-15-1-265-288.
[3] Философия: Энциклопедический словарь. М.: Гардарики. Под редакцией А.А. Ивина. 2004. https://dic.academic.ru/dic.nsf/enc_philosophy/525/классификация наук.
[4] Гордон Б.Г. Нормативная классификация наук. Большая Евразия: развитие, безопасность, сотрудничество. 2019. №2-2. С.890-895.
[5] Стерлигов И. Песнь о классификаторах: OECD, ГРНТИ, ВАК, WoS, Scopus, МСКО... 26 сентября 2013 г. http://isterligov.blogspot.com/2013/09/oecd-wos-scopus.html.
[6] Приказ Минобрнауки России от 24.02.2021 N 118 (ред. от 11.05.2022) «Об утверждении номенклатуры научных специальностей, по которым присуждаются ученые степени, и внесении изменения в Положение о совете по защите диссертаций на соискание ученой степени кандидата наук, на соискание ученой степени доктора наук, утвержденное приказом Минобрнауки России от 10 ноября 2017 г. N 1093».
[7] Рекомендация Президиума ВАК Минобрнауки России от 10.12.2021 N 32/1-НС «О сопряжении научных специальностей номенклатуры, утверждённой приказом Минобрнауки России от 24 февраля 2021 г. N118, научных специальностей номенклатуры, утверждённой приказом Минобрнауки России от 23 октября 2017 г. N 1027».
[8] Овдей О.М., Проскудина Г.Ю. Обзор инструментов инженерии онтологий. Труды 6-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» - RCDL2004, Пущино, Россия, 2004. 10 с. http://rcdl.ru/doc/2004/paper26.pdf.
[9] Карпенко А.П., Сухарь Р.С. Методы отображения онтологий. Обзор. Машиностроение и компьютерные технологии. 2009. №1. 18 с.
[10] Ermolayev V., Davidovsky M. Agent-based ontology alignment: basics, applications, theoretical foundations, and demonstration. WIMS '12: Proceedings of the 2nd International Conference on Web Intelligence, Mining and Semantics. June 2012 Article No.3. P.1-12. https://doi.org/10.1145/2254129.2254136.
[11] Euzenat J., Shvaiko P. Ontology Matching. Second edition. Springer-Verlag, Berlin (DE), 2013. 511p.
[12] Набатов А.Н., Веденяпин И.Э. Онтология объединения информационных подсистем: принципы и примеры. Онтология проектирования. 2020. Т.10, №2. С.218-231. DOI:10.18287/2223-9537-2020-10-2-218-231.
[13] Павлов С.В., Ефремова О.А. Онтологическая модель интеграции разнородных по структуре и тематике пространственных баз данных в единую региональную базу данных. Онтология проектирования. 2017. Т.7, №3(25). С.323-333. DOI:10.18287/2223-9537-2017-7-3-323-333.
[14] Ontology Summit 2016 Communique. Ontologies within Semantic Interoperability Ecosystems. http://ontologforum.org/index.php/OntologySummit2016/Communique.
[15] Баклавски К. Беннет М., Берг-Кросс Г., Шнайдер Т., Шарма Р., Сингер Д. Онтологический Саммит 2020. Коммюнике: Графы знаний. Перевод с англ. Д. Боргест. Онтология проектирования. 2020. Т.10, №4(38). С.540-555. DOI:10.18287/2223-9537-2020- 10-4-540-55.
[16] Revised field of science and technology (FOS) classification in the Frascati Manual. Unclassified DSTI/EAS/STP/NESTI(2006)19/FINAL. 26-Feb-2007. https://www.oecd.org/science/inno/38235147.pdf.
[17] Бармин А.В. К проблеме классификации науки // История науки и техники в системе современных знаний: материалы научной конференции. УПИ, Екатеринбург, 14 декабря 2009 г. С.41-46.
[18] Разеев Д.Н. Проблема классификации наук (феноменологический подход к решению). Вестник Санкт-Петербургского университета. Серия 6, 2010. №2, с.28-32.
[19] Боргест Н.М. Онтологии проектирования от Витрувия до Виттиха // Онтология проектирования. 2018. Т.8, №4(30). С.487-522. DOI:10.18287/2223-9537-2018-8-4-487-522.
[20] Виттих В. Избранные труды по эвергетике (по материалам статей и докладов) / сост. С.Ю. Боровик, Т.В. Моисеева, С.В. Смирнов. - Самара: Издательство «Новая техника», 2022. 420 с.
[21] Гаврилова Т.А., Кудрявцев Д.В., Муромцев Д.И. Инженерия знаний. Модели и методы. СПб.: Издательство «Лань», 2016. 324 с.
[22] Рекомендация ВАК от 11 декабря 2018 года № 8-пл. Об организации работы по совершенствованию номенклатуры научных специальностей, по которым присуждаются ученые степени. 5 с.
[23] Рекомендация ВАК от 26 июня 2019 года № 1-пл/3. О задачах и подходах при разработке Номенклатуры научных специальностей, по которым присуждаются ученые степени. 2 с.
[24] Рекомендация ВАК от 24 декабря 2019 года № 2-пл/1. О разработке номенклатуры научных специальностей, по которым присуждаются ученые степени. 2 с.
[25] Рекомендация ВАК от 2 октября 2020 года № 1-пл/1. О проекте номенклатуры научных специальностей. 2 с.
[26] Рекомендация ВАК от 28 мая 2021 года №15/1-НС. О научных специальностях новой номенклатуры научных специальностей, по которым присуждаются ученые степени. 19 с.
[27] Рекомендация ВАК от 24 июня 2021 года № 1-пл/4. О паспортах научных специальностей. 2 с.
[28] Лукашевич Н.В. Тезаурусы в задачах информационного поиска. М.: Изд-во Московского университета, 2011. 512 c.
[29] Лукашевич Н.В., Добров Б.В. Проектирование лингвистических онтологий для информационных систем в широких предметных областях. Онтология проектирования. 2015. Т.5. №1(15). С.47-69.
[30] Загорулько Ю.А. Семантическая технология разработки интеллектуальных систем, ориентированная на экспертов предметной области. Онтология проектирования. 2015. Т.5, №1(15): 30-46.
[31] Сидорова Е.А. Комплексный подход к исследованию лексических характеристик текста. Вестник СибГУ-ТИ. 2019. № 3. С.80-88.
[32] Загорулько Г.Б. Разработка онтологии для Интернет-ресурса поддержки принятия решений в слабоформа-лизованных областях. Онтология проектирования. 2016. Т.6, №4(22): 485-500. DOI:10.18287/2223-9537-2016-6-4-485-500.
[33] Кононенко И.С., Ахмадеева И.С., Сидорова Е.А., Шестаков В.К. Проблемы извлечения терминологического ядра предметной области из электронных энциклопедических словарей. Системная информатика. 2018. №13. С.49-76. https://system-informatics.ru/ru/article/236.
Сведения об авторе
Боргест Николай Михайлович, 1954 г. рождения. Окончил Куйбышевский авиационный институт имени академика С.П. Королёва (1978), к.т.н. (1985). Доцент кафедры конструкции и проектирования летательных аппаратов Самарского университета, с.н.с. ИПУСС РАН. Член Международной ассоциации по онтологиям и их приложениям, Российской ассоциации искусственного интеллекта. В списке научных трудов более 200 работ в области автоматизации проектирования и ИИ. AuthorID (РИНЦ): 638887. Author ID (Scopus): 56566748500; ORCID: 0000-0003-2934-6198; Researcher ID (WoS): I-8689-2014. [email protected].
Поступила в редакцию 10.09.2022, после рецензирования 20.09.2022. Принята к публикации 25.09.2022.
Scientific article
DOI: 10.18287/2223-9537-2022-12-3-278-298
Development problems of ontology of science: Classification analysis
© 2022, N.M. Borgest
Samara University (Samara National Research University named after academician S.P. Korolev), Samara, Russia Samara Federal Research Scientific Center of the Russian Academy of Science, Institute for the Control of Complex Systems of the Russian Academy of Science, Samara, Russia
Abstract
The existing classifications of science are distinguished by a variety of approaches. The next change in the nomenclature of scientific specialties, presented by the Higher Attestation Commission under the Ministry of Science and Higher Education of the Russian Federation, and the unresolved problem of "simplifying the procedure for making changes and additions to it" determined the relevance of the topic covered in the article. The recommendations of the Higher Attestation Commission on the development of the nomenclature and passports of scientific specialties were considered. The efforts of the Higher Attestation Commission to reduce scientific specialties, their generalization in order to reduce bureaucratic barriers in the qualification assessment of applicants for scientific degrees at the intersection of fields of knowledge were noted. The quantitative results of scientific achievements over the past decade in the form of dissertations submitted for defense in various fields of science are considered. The dominance of technical and medical sciences is expected, while a surge in achievements in economic and political sciences, which was observed especially in 2013-2018, can be noted. The scientific achievements of applicants in the physical and mathematical, philological and biological sciences tend to keep up with the leaders. An analysis of the nomenclature of scientific specialties is presented: names, passports, research areas. A frequency analysis of the terms used in the passports of scientific specialties was carried out. A quantitative assessment of the declared areas of research in scientific specialties and the words used in their description was carried out. A significant difference in approaches to the description of areas of research in scientific specialties and a significant quantitative difference were revealed. As an example, an analysis of the social and humanitarian field of science, which includes the largest number of branches of science, is given. The author believes that the development of the ontology of science will be the very "legal mechanism" for updating the nomenclature, which will allow the Higher Attestation Commission to achieve its goal.
Key words: system analysis, classification of science, nomenclature, scientific specialty, direction of research, ontology.
For citation: Borgest NM. Development problems of ontology of science: Classification analysis [In Russian]. Ontology of designing. 2022; 12(3): 278-298. DOI:10.18287/2223-9537-2022-12-3-278-298.
Acknowledgments: the author expresses his sincere gratitude to his friends and colleagues from Novosibirsk for the opportunity to conduct a study using the Words Finder (software package for building terminological dictionaries, head Yu.A. Zagorulko) and KLAN (software package for creating subject dictionaries, head E.A. Sidorova).
Funding: The study was financially supported by the Ministry of Science and Higher Education of the Russian Federation, research theme code FMRW-2022-0030.
Conflict of interest: The author declares no conflict of interest.
List of figures and tables
Figure 1 - Relationships between areas and branches of science in the nomenclature of scientific specialties [6] Figure 2 - The number of announcements on the defense of dissertations by branches of science on an accrual basis Table 1 - The number of announcements about defenses on the website of the Higher Attestation Commission by
field of science in different periods Table 2 - Scientific specialties accepted in the nomenclature of specialties of the Higher Attestation Commission in
the social and humanitarian field of science Table 3 - Scientific specialties in the social and humanitarian field of science, having two-level areas of research in
the passports of scientific specialties Table 4 - The number of declared areas of research in the passports of scientific specialties, accepted in the nomenclature of specialties of the Higher Attestation Commission, in the social and humanitarian field of science
Table 5 - The number of words used in the description of directions in the passports of scientific specialties, accepted in the nomenclature of specialties of the Higher Attestation Commission, in the social and humanitarian field of science
Table 6 - Statistics of the minimum and maximum texts in terms of the number of words of research areas in the scientific specialties of the social and humanitarian field of science "10.4 Library science, bibliography and book science" and "3.9 Legal psychology and security psychology" Table 7 - A fragment of the high-frequency part of the semantic core for the direction of research in scientific specialties "3.9 Legal psychology and security psychology" Table 8 - Statistics of the text of the direction of research in scientific specialties of the agricultural field of science Table 9 - A fragment of stop words in the text of the direction of research in scientific specialties of the agricultural field of science
Table 10 - A fragment of the high-frequency part of the semantic core of the direction of research in the scientific specialties of the agricultural field of science (based on the Advego program) Table 11 - A fragment of the high-frequency part of the word complex of research directions in scientific specialties of
the agricultural field of science (based on the KLAN program) Table 12 - High-frequency terms in the directions of research of scientific specialties in various fields of science
(based on the Words Finder program) Table 13 - Fragments of the high-frequency (more than 15 repetitions when describing the field of science) part of the word complexes of research areas in scientific specialties in various fields of science (based on the KLAN program)
Table 14 - High-frequency one-, two- and three-word terms in research areas of scientific specialties in all fields of science (based on the Words Finder program)
References
[1] Borgest NM. Ontology of designing a scientific direction: formation, development, examples [In Russian]. Ontology of designing. 2022; 12(2): 136-157. DOI:10.18287/2223-9537-2022-12-2-136-157.
[2] ZhmudLYa. Two ancient classifications of sciences: Aristotle and Gemin [In Russian]. Schole, 2021; 15(1): 265288. D0I:10.25205/1995-4328-2021-15-1-265-288.
[3] Philosophy: Encyclopedic Dictionary [In Russian]. Moscow: Gardariki. Edited by A.A. Ivin. 2004.
[4] Gordon BG. Normative classification of sciences [In Russian]. Greater Eurasia: development, security, cooperation. 2019; 2-2: 890-895.
[5] Sterligov I. Song about classifiers: OECD, SRSTI, VAK, WoS, Scopus, MSCO... [In Russian]. September 26, 2013. http://isterligov.blogspot.com/2013/09/oecd-wos-scopus.html.
[6] Order of the Ministry of Education and Science of Russia dated February 24, 2021 N 118 (as amended on May 11, 2022) [In Russian]. "On approval of the nomenclature of scientific specialties for which academic degrees are awarded, and amendments to the Regulations on the Council for the defense of dissertations for the degree of Candidate of Sciences, for the degree of Doctor of Science, approved by order of the Ministry of Education and Science of the Russian Federation of November 10, 2017 N 1093".
[7] Recommendation of the Presidium of the Higher Attestation Commission of the Ministry of Education and Science of Russia dated December 10, 2021 N 32 / 1 -NS [In Russian]. "On the conjugation of scientific specialties of the nomenclature approved by order of the Ministry of Education and Science of Russia of February 24, 2021 N118, scientific specialties of the nomenclature approved by order of the Ministry of Education and Science of Russia of October 23, 2017 No. 1027".
[8] Ovdey OM, Proskudina GYu. An overview of ontology engineering tools [In Russian]. Proceedings of the 6th All-Russian Scientific Conference "Digital Libraries: Advanced Methods and Technologies, Electronic Collections" - RCDL2004, Pushchino, Russia, 2004. 10 p. http://rcdl.ru/doc/2004/paper26.pdf.
[9] Karpenko AP, Sukhar RS. Ontology mapping methods. Review [In Russian]. Mechanical engineering and computer technologies. 2009; 1: 1-18.
[10] Ermolayev V, Davidovsky M. Agent-based ontology alignment: basics, applications, theoretical foundations, and demonstration. WIMS '12: Proceedings of the 2nd International Conference on Web Intelligence, Mining and Semantics. June 2012 Article No.3. P.1-12. https://doi.org/10.1145/2254129.2254136.
[11] Euzenat J, Shvaiko P. Ontology Matching. Second edition. Springer-Verlag, Berlin Heidelberg (DE), 2013. 511p.
[12] Nabatov AN, Vedenyapin IE. The ontology of merging information subsystems: principles and examples [In Russian]. Ontology of designing. 2020; 10(2): 218-231. - DOI: 10.18287/2223-9537-2020-10-2-218-231.
[13] Pavlov SV, Efremova OA. Ontological model for integration of structurally heterogeneous spatial databases of various subject areas into a uniform regional database. Ontology of designing. 2017; 7(3): 323-333. DOI: 10.18287/2223-9537-2017-7-3-323-333.
[14] Ontology Summit 2016 Communique. Ontologies within Semantic Interoperability Ecosystems. http://ontologforum.org/index.php/OntologySummit2016/Communique.
[15] Ontology Summit 2020: Knowledge Graphs. https://ontologforum.s3.amazonaws.com/OntologySummit2020/Communique/OntologySummit2020Communique.pdf.
[16] Revised field of science and technology (FOS) classification in the Frascati Manual. Unclassified DSTI/EAS/STP/NESTI(2006)19/FINAL. 26-Feb-2007. https://www.oecd.org/science/inno/38235147.pdf.
[17] Barmin AV. On the problem of classification of science [In Russian]. History of science and technology in the system of modern knowledge: materials of a scientific conference. UPI, Yekaterinburg, Dec. 14, 2009, p.41-46.
[18] Razeev DN. The problem of classification of sciences (phenomenological approach to the solution). Bulletin of St. Petersburg University. Series 6, 2010. No. 2, pp. 28-32.
[19] Borgest NM. The ontologies of designing from Vitruvia to Vittikh [In Russian]. Ontology of designing. 2018; 8(4): 487-522. DOI: 10.18287/2223-9537-2018-8-4-487-522.
[20] Vittich V. Selected works on evergetics (based on articles and reports) [In Russian]. Comp. S.Yu. Borovik, T.V. Moiseeva, S.V. Smirnov. Samara: New Engineering Publishing House, 2022. 420 p.
[21] Gavrilova TA, Kudryavtsev DV, Muromtsev DI. Knowledge engineering. Models and Methods. St. Petersburg: Publishing house «Lan», 2016. 324 p.
[22] Recommendation of the Higher Attestation Commission. December 11, 2018 No.8-pl [In Russian]. On the organization of work to improve the range of scientific specialties for which academic degrees are awarded. 5 p.
[23] Recommendation of the Higher Attestation Commission. June 26, 2019 No.1-pl/3 [In Russian]. On the tasks and approaches in the development of the Nomenclature of scientific specialties for which academic degrees are awarded. 2 p.
[24] Recommendation of the Higher Attestation Commission. December 24, 2019 No.2-pl/1 [In Russian]. On the development of the nomenclature of scientific specialties for which academic degrees are awarded. 2 p.
[25] Recommendation of the Supreme Attestation Commission. October 2, 2020 No. 1 -pl/1 [In Russian]. On the project of the nomenclature of scientific specialties. 2 p.
[26] Recommendation of the Higher Attestation Commission. May 28, 2021 No.15/1-NS [In Russian]. On the scientific specialties of the new nomenclature of scientific specialties for which academic degrees are awarded. 19 p.
[27] Recommendation of the Higher Attestation Commission. June 24, 2021 No.1-pl/4 [In Russian]. On the passports of scientific specialties. 2 p.
[28] Lukashevich NV. Thesauri in information retrieval problems [In Russian]. Moscow: Moscow University Press, 2011. 512 p.
[29] Loukachevitch NV, Dobrov BV. Developing linguistic ontologies in broad domains [In Russian]. Ontology of designing. 2015; 5(1): 47-69.
[30] Zagorulko GB. Development of ontology for intelligent scientific internet resource decision-making support in weakly formalized domains [In Russian]. Ontology of designing. 2016; 6(4): 485-500. DOI: 10.18287/2223-95372016-6-4-485-500.
[31] Sidorova E. The integrated approach to text lexical characteristics study [In Russian]. Bulletin of SibGUTI. 2019; 3: 80-88.
[32] Zagorulko GB. Semantic technology for development of intelligent systems oriented on experts in subject domain [In Russian]. Ontology of designing. 2015; 5(1): 30-46.
[33] Kononenko IS, Akhmadeeva IS, Sidorova EA, Shestakov VK. Problems of extracting the terminological core of the subject area from electronic encyclopedic dictionaries [In Russian]. System informatics. 2018; 13: 49-76. https://system-informatics.ru/ru/article/236.
About the author
Nikolay Mikhailovich Borgest (b.1954) graduated from the Kuibyshev Aviation Institute named after academician S.P. Korolev (Kuibyshev) in 1978, PhD (1985). He is a Associate Professor at Samara National Research University named after academician S.P. Korolev, Senior Research worker at ICCS RAS. He is a member of the International Association for Ontology and its Applications, a member of the Russian Association of Artificial Intelligence, a co-author of more than 200 scientific articles and abstracts in the field of CAD and AI. AuthorID (RCI): 638887. Author ID (Scopus): 56566748500; ORCID: 0000-0003-2934-6198; Researcher ID (WoS): I-8689-2014. [email protected].
Received September 10, 2022. Revised September 20, 2022. Accepted September 25, 2022.