Научная статья на тему 'Онтологическое моделирование пространства знаний области исторической демографии Северо-Западного Кавказа [1]'

Онтологическое моделирование пространства знаний области исторической демографии Северо-Западного Кавказа [1] Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
238
60
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИСТОРИЧЕСКАЯ ДЕМОГРАФИЯ / СЕВЕРО-ЗАПАДНЫЙ КАВКАЗ / ОНТОЛОГИЯ / ПРЕДСТАВЛЕНИЕ ЗНАНИЙ / ФОРМАЛИЗАЦИЯ / ПРОСТРАНСТВО ЗНАНИЙ / КЛАССИФИКАЦИЯ / HISTORICAL DEMOGRAPHY / DEMOGRAPHY / NORTHWEST CAUCASUS / ONTOLOGY / KNOWLEDGE REPRESENTATION / FORMALIZATION / KNOWLEDGE SPACE / CLASSIFICATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Костенко Константин Иванович, Ракачева Ярослава Владимировна, Левицкий Борис Ефимович, Белкин Виктор Юрьевич

В статье рассматриваются принципы, методы, порядок онтологического моделирования пространства знаний применительно к области исторической демографии СевероЗападного Кавказа, обосновывается необходимость создания подобного рода информационных систем.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Костенко Константин Иванович, Ракачева Ярослава Владимировна, Левицкий Борис Ефимович, Белкин Виктор Юрьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ONTOLOGICAL MODELING OF THE KNOWLEDGE SPACE WITH REGARD TO HISTORICAL DEMOGRAPHY OF THE NORTHWESTERN CAUCASUS [1]

The paper describes principles, methods and procedures of the knowledge space ontological modeling regarding historical demography of the Northwest Caucasus. The authors substantiate the need for that kind of information systems development.

Текст научной работы на тему «Онтологическое моделирование пространства знаний области исторической демографии Северо-Западного Кавказа [1]»

УДК 001.92 025.4 Костенко Константин Иванович

кандидат физико-математических наук, доцент, заведующий кафедрой интеллектуальных информационных систем Кубанского государственного университета, заведующий отделом разработки информационных систем Центра Интернет Кубанского государственного университета [email protected]

Ракачева Ярослава Владимировна

кандидат исторических наук, доцент кафедры социологии Кубанского государственного университета [email protected]

Левицкий Борис Ефимович

проректор по информатизации Кубанского государственного университета [email protected]

Белкин Виктор Юрьевич

ведущий программист Центра Интернет Кубанского государственного университета [email protected]

ОНТОЛОГИЧЕСКОЕ МОДЕЛИРОВАНИЕ ПРОСТРАНСТВА ЗНАНИЙ ОБЛАСТИ ИСТОРИЧЕСКОЙ ДЕМОГРАФИИ

СЕВЕРО-ЗАПАДНОГО КАВКАЗА [1]

Kostenko Konstantin Ivanovich

PhD (Phys.-Math.), Assistant Professor, Head of the Intelligent Information Systems Subdepartment, Head of the Internet Center’s Data System Development Department, Kuban State University [email protected]

Rakacheva Yaroslava Vladimirovna

PhD in History, Assistant Professor of the Social Science Department, Kuban State University [email protected]

Levitsky Boris Efimovich

Vice Principle for Information System Development, Kuban State University [email protected]

Belkin Victor Yuryevich

Senior Programmer at Internet Centre, Kuban State University [email protected]

ONTOLOGICAL MODELING OF THE KNOWLEDGE SPACE WITH REGARD TO HISTORICAL DEMOGRAPHY OF THE NORTHWESTERN CAUCASUS [1]

Аннотация:

В статье рассматриваются принципы, методы, порядок онтологического моделирования пространства знаний применительно к области исторической демографии СевероЗападного Кавказа, обосновывается необходимость создания подобного рода информационных систем.

Ключевые слова:

историческая демография, Северо-Западный Кавказ, онтология, представление знаний, формализация, пространство знаний, классификация.

The summary:

The paper describes principles, methods and procedures of the knowledge space ontological modeling regarding historical demography of the Northwest Caucasus. The authors substantiate the need for that kind of information systems development.

Keywords:

Historical demography, demography, Northwest Caucasus, ontology, knowledge representation, formalization, knowledge space, classification.

Одним из свойств современного общества является переход к применению технологий автоматической обработки знаний в цифровой форме с целью решения различных профессиональных задач. Массивы таких знаний составляют цифровые пространства знаний. Они позволяют накапливать и исследовать разнообразные сведения, составляющие существующий теоретический и экспертный опыт в соответствующей предметной области. Процесс построения пространств знаний предполагает участие специалистов (экспертов), реализующих модель пространства в виде специальной семантической структуры.

ИСТОРИЯ

Демография относится к важнейшим областям знаний, владение которыми обеспечивает возможность нахождения решения сложных социально-экономических проблем. Поэтому исключительно важно обеспечить формирование, распространение и использование таких систем знаний области демографии, которые обладают истинностью, полнотой, существенностью. Игнорирование демографических знаний, принятие решений различного рода и уровня без предварительной демографической экспертизы связано с возможностью ошибок, имеющих высокую социальную и политическую стоимость.

В российском обществе постепенно формируется понимание важности и необходимости демографии, распространения демографических знаний, грамотное оперирование демографическими данными. Эта информация все чаще фигурирует в СМИ, растет число ресурсов, посвященных демографии и демографическим проблемам. Кроме того, постепенно распространяется преподавание демографии за пределы чисто профессиональных занятий демографов или статистиков. Курсы демографии читаются будущим экономистам, юристам, социологам, географам, социологам, маркетологам, специалистам в области управления и психологии, политологам.

Демография, знание ее основ, знание процессов, которые происходят в населении, и управляющих ими законов, может помочь правильно ответить на многие сложные и актуальные вопросы современного общества.

В современных условиях массовой информатизации и компьютеризации возникают широкие возможности обработки, использования и распространения демографических данных и знаний путем создания электронных ресурсов (сайтов, баз данных, электронных каталогов и пр.), доступных широкому кругу пользователей от высококвалифицированных экспертов до специалистов, профессиональные задачи и интересы которых касаются тематики науки демографии.

В условиях перехода к обществу, основанному на знаниях как фундаменте развития социальных и экономических систем становится необходимой трансформация массивов знаний, накопленных в разных областях в интеллектуальные информационные ресурсы, конструируемые с помощью технологий инженерии знаний.

Ключевым этапом проектирования интеллектуальных информационных систем является концептуальное моделирование предметной области, позволяющее сформировать представления о структуре и специфических свойствах многообразий знаний в моделируемых предметных областях. Расположение в поле рабочей доступности различных по содержанию и наполнению информационных ресурсов и обеспечение доступа к ним на семантическом уровне сегодня является задачей образовательного и научного процесса.

Это также отвечает современным вызовам времени, где важны объединения усилий различных наук как естественного, так и гуманитарного профиля.

Такой модельной базой концентрации знаний выступают онтологии, представляющие собой эксплицитную систему, где в качестве концептуализации выступает описание множества объектов и связей между ними на формальном языке, в которых фиксируются договоренности группы специалистов о том, что и как называется в их области и через какие роли и фильтры рассматривается.

Простейшими, но распространенными примерами онтологий являются системы классификаций Д.И. Менделеева, К. Линнея и др.

Более того, имеется представление, что в любой области знаний существует своя классификационная система, которая лежит в ее основе. Естественно, эти классификационные системы довольно устойчивы, но все-таки изменяются по мере развития наук.

В нашем случае онтологическая модель позволит рассматривать взаимосвязь демографических, миграционных и социальных процессов на Северо-Западном Кавказе с

учетом исторической ретроспективы. Применение математического аппарата для моделирования демографических процессов заполнит значительные пробелы в научном освещении демографических данных и позволит на более серьезном научном уровне говорить не только о социальном прогнозировании и социальном проектировании масштабных социальных процессов, но и реконструкции их в исторической ретроспективе.

Характеризуя основы логико-онтологического подхода к моделированию целостных систем знаний, отметим, что слабо формализованное символьное представление многообразий предметных и профессиональных знаний является распространенным (основным) форматом современных интеллектуальных информационных систем, предоставляющих разнообразные возможности эффективного использования при решении профессиональных задач. Современная концепция таких ресурсов реализует основанный на онтологиях подход к моделированию, в котором такие многообразия задаются в структурированном связном виде, объединяемым общей структурой, называемой онтологией области знаний. При этом каждый интеллектуальный ресурс обеспечивает формирование истинного взгляда на мир, согласно которому полное знание представляется семантической (онтологической) структурой. Создание и применение такой структуры делает возможной автоматизацию процессов работы со знаниями, включая этапы приобретения, извлечения, структуризации, представления и практического применения знаний специалистами в профессиональной деятельности. Также должны обеспечиваться возможности сравнения и анализа содержания фрагментов, полноты, непротиворечивости и возможности обобщения знаний, размещенных в информационной среде.

Абстрактно-теоретическое исследование понятия «онтология» определяет элементарное (неделимое) знание в качестве первичного элемента всякого целостного многообразия знаний. Такие знания извлекаются из различных первичных ресурсов. Основной формат для таких ресурсов - электронный. Примерами первоисточников элементарных знаний являются монографии, учебники, научные статьи, терминологические словари, базы эмпирических данных (фактов).

Элементарные знания наделяются свойствами, обеспечивающими их многозначную классификацию, реализуемую в форме иерархий классов таких знаний. Свойства являются основным источником сведений об элементарных знаниях, которые применяются для организации процессов навигации и поиска знаний, а также синтеза сложных знаний на основе элементарных. При этом сложные знания составляются из элементарных с использованием семантических отношений и образуют семантические сети, адаптированные к особенностям форматов и структур представления и связывания знаний, применяемых в соответствующих областях.

Унифицированными, универсальными типами свойств являются классификаторы, роли и фильтры знаний [2; 3]. Классификаторы соответствуют разбиению предметных областей на подобласти, разделы, темы, а также профессиональных знаний, составляющие иерархию задач, подзадач, методов и профессиональных приемов. Роли обозначают свойства произвольных знаний, отражающих их назначение в целостном содержании конкретного массива знаний. Фильтры - это качественные свойства знаний, характеризующие способ представления, включая стиль, полноту, уровень, значимость, истинность. Фильтры обеспечивают сравнимость и взаимную адаптацию отдельных знаний. При этом сложные знания, как правило, составляются на основе типовых шаблонов, в которых указаны роли элементарных знаний, составляющих сложные знания и семантические связи, существующие между такими знаниями.

- 37-

Словарь юнр™ Демографии

<* — -

теоретическая

база

Итоговые знания (законы демографии)

Теоретические

модели

Задачі демографических исследоеам)

Осноміе

модели

\\

Спецгапыаде

модели

4

і,

Зада-м

Методы

исследоеашя

V

Ч'Х \ " і

Модель погистичаско го населения \ Ч \ М0ДЄЛ& Проведения переписи

Модегь миграционного гюремщв

Модель демографического перехода

модель экспоненциального

уЯ Г~ АПАцЦ В

ПОШ1 Ипп л

Демография северо-западного Кавказа

-7~

"V

Историческая период мзация

ж

База аналитических материалов

і і \

/ \ \

/ і \

/ \ \

/ і

Архив лер алчных материалов

Обзоры и бибпиофафш

'

Монографии Статьи

Статистические

материалы

£

Перетки

X у

I

Текуіфи статиста ческ м учет

т-~т

/ I і і

XVIII век

/ \

і

Архивные

ИСТОЧНИКИ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

I \ I

у XIX век XX век

XXI век

Нормативная

Вам

7—V

/

/

Официальные

данные

Опросы

Законы

Указы и раслоряжеши органов государственной власти

Эти положения легли в основу построения системы онтологического моделирования предметных знаний области исторической демографии «Демография Северо-Западного Кавказа» на платформе wiki.kubsu.ru Кубанского государственного университета.

Соответственно важнейшей задачей, стоящей перед исследовательским коллективом, стало построение классификатора.

Построение классификатора предметных знаний для области исторической демографии связано с отражением сложившейся структуры разделов, достаточной для достижения целей создаваемого пространства знаний. Прототип системы классов создаваемой интеллектуальной информационной среды рассматриваемой предметной области приведен на рис. 1.

Он отражает единство массивов исторических документов, обеспечивающих достоверность представленных материалов, вместе с результатами моделирования содержания первичных ресурсов, формирующими единую, связную, обоснованную структуру. Классификатор предметных знаний полностью определяется особенностями моделируемой предметной области.

Основные разделы классификатора составляют области структурированных знаний, составляющих содержание теории демографии, представленные разделами теоретических моделей постановок задач и методов их решения, законов демографии. Теоретические знания области демографии являются универсальными и непосредственно не представляют знание о демографии Северо-Западного Кавказа, однако оказываются логически с ним связанными, поскольку выступают элементарной теоретической базой для понимания и осмысления демографии региона, в силу чего эта область знаний является необходимой и включена в классификатор в качестве самостоятельного раздела.

Эмпирическую часть классификатора составляют архивы первичных документов (ресурсов) разных типов. Эта область знания является исходной фактологической базой для изучения и анализа демографических процессов Северо-Западного Кавказа. Она представлена значительным массивом разнообразных статистико-демографических данных. В первую очередь это материалы Всеобщих переписей населения 1897, 1926, 1937, 1939, 1959, 1970, 1979, 1989 и 2002 гг., представляющих данные по региону. Кроме этого, материалы текущих статистических учетов, сводок, обследований, многие из которых уникальны. Значительная часть этих данных в их материальном виде доступна узкому кругу исследователей (поскольку хранится в архивах), включение их в онтологию позволит сделать их доступными широкому кругу пользователей.

Историзм демографических знаний связан с классификацией теоретических и эмпирических сведений с тщательно проработанной периодизацией демографических процессов. Критерии периодизации представляются весьма относительными и, следовательно, могут варьироваться в зависимости от задач и целей такой периодизации. В данном случае возможна многоуровневая и многоосновная периодизация, которая может иметь собственно хронологическое основание (век, десятилетие и т. д.), историческое (вехи исторического развития страны, региона), статистико-демографическое (привязана к датам проведения переписей) и т. д.

Система ролей элементарных знаний представлена на рис. 2.

-39-

-0І7-

Общенаучный

уТ

Узкоспециальный

Содержательный

ОБЩЕСТВО: ФИЛОСОФИЯ, ИСТОРИЯ, КУЛЬТУРА (2012, №4)

ИСТОРИЯ

В ней реализован опыт декомпозиции и структуризации первичных ресурсов разных типов на семантически однородные фрагменты (элементарные знания). Применение ролей позволяет накапливать в составе интеллектуальной системы для области знаний семейства неделимых знаний, из которых составляется текущая конфигурация знаний, созданных и применяемых в рассматриваемой предметной области. Роли существенно зависят от особенностей предметной области, но обладают определенной универсальностью. При этом всякое элементарное знание наделяется единственной ролью из приведенной структуры, максимально соответствующей его назначению. Роли позволяют не включать в состав информационных ресурсов, синтезируемых на основе запросов, сведений, не относящихся к содержанию запросов.

Система фильтров знаний области исторической демографии обладает наибольшей универсальностью и в значительной степени переносима на произвольные предметные области. Фрагмент разработанной системы фильтров приведен на рис. 3. Основное назначение ролей связано с адаптацией массивов элементарных знаний к уровню потребностей пользователей, предоставляемых поисковыми запросами. Фильтры позволяют адаптировать информационные ресурсы в составе интеллектуальной системы к профессиональному уровню пользователей.

Таким образом, построение классификатора, ролей и фильтров позволяет реализовать задачу по созданию модели онтологии для цифрового пространства, содержащего в структурированном и связном виде разнообразные знания, модели и методы исторической демографии, предоставляющую экспертам и специалистам возможность автоматизации процессов извлечения, анализа и накопления знаний, а также практического применения знаний в цифровой форме для решения образовательных и профессиональных задач на основе размещенной в электронной форме системы знаний и обеспечения доступа к ней.

Ссылки и примечания:

1. Материалы подготовлены в рамках реализации проекта «Онтологическое моделирование теоретических и практических знаний области исторической демографии» при финансовой поддержке РГНФ, проект № 12-01-12038в.

2. Костенко К.И. Левицкий Б.Е. Системный анализ технологии проектирования, сопровождения и использования информационных сред областей знаний // Известия вузов. Северо-Кавказский регион. Естественные науки. 2005. № 3. С. 11-16.

3. Костенко К.И., Кузьменко И.П., Левицкий Б.Е. Классы операций цифровых пространств знаний // Информатизация образования и науки. 2010. № 2 (6). С. 137-152.

References (transliterated) and notes:

1. The article was performed with financial support from the Russian Humanities Research Foundation, project “Ontological modeling of theoretical and practical knowledge on historic demography” № 12-01-12038в.

2. Kostenko K.I. Levitskiy B.E. Sistemniy analiz tekhnologii proektirovaniya, soprovozhdeniya i ispol'zovaniya infor-matsionnykh sred oblastey znaniy // Izvestiya vuzov. Severo-Kavkazskiy region. Estestvennie nauki. 2005. № 3. P. 11-16.

3. Kostenko K.I., Kuz'menko I.P., Levitskiy B.E. Klassy operatsiy tsifrovykh prostranstv znaniy // Informatizatsiya obrazovaniya i nauki. 2010. № 2 (6). P. 137-152.

i Надоели баннеры? Вы всегда можете отключить рекламу.