Научная статья на тему 'ОСОБЕННОСТИ ПРОЕКТИРОВАНИЯ БАЗ ДАННЫХ ДЛЯ АВТОМАТИЗИРОВАННОГО РАБОЧЕГО МЕСТА ВРАЧА-НУТРИЦИОЛОГА'

ОСОБЕННОСТИ ПРОЕКТИРОВАНИЯ БАЗ ДАННЫХ ДЛЯ АВТОМАТИЗИРОВАННОГО РАБОЧЕГО МЕСТА ВРАЧА-НУТРИЦИОЛОГА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
146
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЦИФРОВАЯ НУТРИЦИОЛОГИЯ / СИСТЕМНАЯ ИНЖЕНЕРИЯ / ПРОГРАММНАЯ ИНЖЕНЕРИЯ / СИСТЕМА ПЛАНИРОВАНИЯ ДИЕТИЧЕСКОГО ПИТАНИЯ / МЕДИЦИНСКАЯ ИНФОРМАТИКА / БАЗА ДАННЫХ / СИСТЕМА УПРАВЛЕНИЯ БАЗОЙ ДАННЫХ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Хлопотов Роман Сергеевич

В статье представлены результаты аргументации перечня информации, необходимой для разработки персонифицированного рациона питания, удовлетворяющего требованиям нутрициологии и диетологии. В результате анализа сформированного перечня обоснован состав комплекса баз данных, наличие которых позволит адекватно реализовать функционал автоматизированного рабочего места врача-нутрициолога.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Хлопотов Роман Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FEATURES OF DATABASE DESIGN FOR THE AUTOMATED WORKSTATION OF A NUTRITIONAL DOCTOR

The article presents the results of the argumentation of the list of information necessary for the development of a personalized diet that meets the requirements of nutrition and dietology. As a result of the analysis of the generated list, the composition of the database complex is substantiated, the presence of which will allow adequately implementing the functionality of the automated workplace of a nutritionist.

Текст научной работы на тему «ОСОБЕННОСТИ ПРОЕКТИРОВАНИЯ БАЗ ДАННЫХ ДЛЯ АВТОМАТИЗИРОВАННОГО РАБОЧЕГО МЕСТА ВРАЧА-НУТРИЦИОЛОГА»

Славин Олег Анатольевич, д-р техн. наук, главный научный сотрудник, oslavin@isa.ru, Россия, Москва, Федеральный исследовательский центр «Информатика и управление » Российской академии наук

APPLICA TION OF CONSTELLATIONS OF TEXT SINGLE POINTS FOR ANALYSIS OF THE CONTENT

OF RECOGNIZED TEXT DOCUMENTS

O.A. Slavin

The paper considers a method for analyzing the content of recognized text documents based on the model of constellations of text singular points - words that are unique for some neighborhood of the text. Point descriptors extracted from document images using a character recognition system are considered. Matching of words with recognition errors is carried out on the basis of the modified normalized Levenshtein distance. Constellations of textual keypoints are described as sets of chains, and chains are described as sequences of generalized terms, which are defined as sets of textual keypoints that may appear in a particular place in a document. An algorithm for searching for a match between a set of words in a recognized document and a set of constellation models is described. The problems of classification and binding of document fields are considered. The results of an experimental verification of the implementation of the algorithm on test data sets of business documents are presented.

Key words: business documents, document recognition, Levenshtein distance, text singular point, constellation of points, generalized term.

Slavin Oleg Anatolyevitch, doctor of technical sciences, chief researcher, oslavin@isa.ru, Russia, Moscow, Federal Research Center «Informatics and Management» of the Russian Academy of Sciences

УДК 61.614.23

DOI: 10.24412/2071-6168-2022-9-84-90

ОСОБЕННОСТИ ПРОЕКТИРОВАНИЯ БАЗ ДАННЫХ ДЛЯ АВТОМАТИЗИРОВАННОГО РАБОЧЕГО МЕСТА ВРАЧА-НУТРИЦИОЛОГА

Р.С. Хлопотов

В статье представлены результаты аргументации перечня информации, необходимой для разработки персонифицированного рациона питания, удовлетворяющего требованиям нутрициологии и диетологии. В результате анализа сформированного перечня обоснован состав комплекса баз данных, наличие которых позволит адекватно реализовать функционал автоматизированного рабочего места врача-нутрициолога.

Ключевые слова: цифровая нутрициология, системная инженерия, программная инженерия, система планирования диетического питания, медицинская информатика, база данных, система управления базой данных.

В современном мире в сфере медицинских услуг формируются и накапливаются большие объемы медицинских данных [1, 2]. От того, насколько своевременно и эффективно весь объём информации используется врачами разной специальности зависит качество оказываемых специалистами медицинской консультации и помощи [3, 4]. Не является исключением и врач-нутрициолог: для оптимизации организации и непосредственного оказания им консультативно-диагностических услуг крайне важным является как эффективное использование всей накопленной информации, так выявление и использование неявных закономерностей и тенденций, выявляемых с помощью специального анализа [5, 6]. Решение этих задач обуславливает актуальность создания и использования автоматизированных информационно-аналитических систем в практике врача-нутрициолога [7-9].

Следует отметить, что разработка такой автоматизированной системы является достаточно сложной, многоплановой и трудоёмкой задачей, предполагающей разработку всех видов ее обеспечения: лингвистического, технического, информационного, программного, математического, а также осуществления ряда организационных мероприятий, обеспечивающих функционирование создаваемой системы [10].

Предлагаемая схема информационной интеллектуальной поддержки деятельности врача-нутрициолога представлена на рис. 1.

Рекомендуемая схема предусматривает основные этапы деятельности врача-нутрициолога при организации консультативно-диагностического процесса.

ObMLII

V^7

KOHCVJIbTATI П1НО.Д11АГНОС Л ЕЧЕСХПЙ ПРОЦЕСС

- лифф?реиииальЕ[ое обсле^омшк:

- фориЕЕрояятте прлвитгъпйго РШ1Е1ПНЯ ]] mnncvhrc npi Tt Ы Ч Lt

- янецеееч чкч жнуеееччч: :|\:>11чч:к я II: \ нприЕшвгчяЕцзя и ekjcc тнокпсннс;

- никктн .цефпщла мппералоа, BimMiiEioB. коррекщи проблемы с помощью

прйвее-чыеого пигчшы

- црофЕЕЛдстша ожэзренЕЕЯ el мбо ьшсчрые влеку! чд cg£oh лещешеЛ вес;

- ешывап гансуннапану» помощь.

СИСТЕМА КОМПЬЮТЕРНЫХ ТЕХНОЛОПЙ ИНТЕЛЕКГ/АТЬНОГ] ПОДДЕРЖКИ

Рис. 1. Схема информационной интеллектуальной поддержки деятельности врача-нутрициолога

Согласно рис. 1 основой автоматизации процесов функционирования разрабатываемой системы являются современные информационные технологии, базирующиеся на использовании вычислительной техники, объединении ее в различные классы сети, создание локальных и территориально-распределенных банков данных с реализацией режима видеообработки, развития экспертных систем, обеспечивающих дружественный интерфейс пользователям информационных систем [11-13].

Отметим, что комплексная компьютеризация деятельности врача-нутрициолога помимо развития общей методологии требует проработки ряда специфических вопросов. К ним, в частности, относятся:

- выбор систем управления базами данных (СУБД), в том числе для медицинских приложений;

- интеллектуализации баз данных;

- формирования, на основе содержащейся информации в базах данных, «аналитической» и «оперативной» форм информации;

- надежности и безопасности;

- перехода на цифровые технологии с возможностью автоматизированного анализа данных;

- горизонтальной и вертикальной интеграцией информации и др. [11, 14, 15].

Исходя из выше сказанного, основой функционирования современных информационных технологий является концепция интегрированных баз данных. В связи с этим, базе данных должно быть свойственно накапливание, хранение и обновление данных, а также предоставление пользователям быстрый доступ к требующимся данным. Для этого в базе данных должны быть организованы и структурированы в соответствии с определенной моделью предметной области (в нашем случае консультативная деятельность врача-нутрициолога), представляющей собой совокупность объектов, их свойств и связей между ними [5, 11].

Следует отметить, что база данных не только функционирует внутри информационой системы, но и развивается вместе с этой системой. Поэтому в начале 80-х годов введен термин жизненный цикл базы данных (Database Live Cycle, DBLC) (рис. 2) [16].

ПЛАНИРОВАНИЕ

Рис. 2. Жизненный цикл проекта БД

85

Состав процессов жизненного цикла, как, впрочем, и всего остального программного обеспечения, регламентируется международным стандартом «Системная и программная инженерия - Процессы жизненного цикла» ( ISO/IEC 12207:2008 Systems and software engineering - Software life cycle processes) [17]. Согласно рис. 2, ключевым этапом в жизненном цикле БД является именно процесс разработки.

Традиционно медицинские записи ведутся в виде «человекочитаемого» текста и рассчитаны на прочтение, обработку, анализ и оценку именно человеком. Такой способ обработки информации является пока основным в диагностическо-консультативном процессе. При этом, автоматизация обработки данных выдвигает дополнительные требования к ведению медицинской информации, а именно к ее формализации и кодированию. Именно формализация и кодирование информации обеспечивают огромное преимущества компьютерной обработки [18]. Под формализацией в этом случае понимается структурирование информации, разделение ее на конкретные разделы и подразделы, вплоть до выделения признаков и атрибутов каждой медицинской сущности и четкого описания всех этих признаков в медицинском документе [13, 19].

В связи с этим, проектирование базы данных - это сложный многоэтапный процесс принятия взвешенных решений в процессе анализа информационной модели программного обеспечения, требований к данным со стороны прикладных программистов и пользователей, синтеза логических и физических структур данных, а также анализа и обоснования выбора программных и аппаратных средств [12].

В результате решения основных вопросов проектирования базы данных должны быть определены: содержание базы данных, эффективный способ организации данных, который будет удовлетворять потребности всех её будущих пользователей, а также инструментальные средства управления данными.

Процесс разработки базы данных можно разбить на несколько этапов:

- исследование предметной области;

- создание инфологической (информационно-логической) модели;

- создание датологической модели;

- создание физической модели.

На первом этапе проектирования базы данных производится системный анализ предметной области. Результаты анализа предметной области, а именно, модели данных на семантическом уровне, являются исходными данными для решения задач проектирования базы данных [20]. Предметная область информационной системы рассматривается как совокупность реальных процессов и объектов (сущностей), представляющих интерес для её пользователей [16]. Каждая из сущностей предметной области обладает определённым набором свойств (атрибутов). Таким образом, для сущности «КЛИЕНТ» в качестве атрибутов можно выбрать следующие: ФИО, адрес, телефон, биометрические данные (рост, вес, пол), хронические болезни, анализы, аллергия, способ жизни и др.

Информация о предметной области, с которой работают пользователи, отображается, в первую очередь, в инфологической модели, затем в датологической и, наконец, в физической модели [19].

Так, в инфологической модели в интегрированном виде отражаются состав и структура данных, а также информационные потребности приложений (задачи и запросы). Эта модель отражает предметную область в виде совокупности информационных объектов и их структурных связей.

В качестве инструмента для построения модели данных на этапе проектированияцелесообраз-но выбрать модель «сущность-связь» (Entity-Relationship). Это аргументировано тем, что такая модель наглядна, проста, содержать все сведения для дальнейших этапов проектирования, а также легко преобразовывать в модели баз данных для распространенных систем управления базами данных. Основными ее преимуществами является направленность на семантическую нагрузку информации о реальном времени, способствующую логическому представлению данных, определение значения данных в контексте их взаимосвязи с другими данными. Из модели «сущность-связь» могут быть порождены все существующие модели данных (иерархическая, сетевая, реляционная, объектная) [17]. Основываясь на перечисленных преимуществах, мы считаем, что использование именно этой модели является наиболее рациональным.

По окончании этого этапа получаем концептуальную модель, инвариантную к структуре базы

данных.

Теперь что бы составить полную инфологическую модель задачи «КЛИЕНТ». Для этого перечислим те правила, которым должна удовлетворять модель «сущность-связь»:

- полное представление о предметной области;

- должны быть перечислены все необходимые для реализации задачи сущности и их атрибуты соответственно;

-должны быть уникальны имена сущностей и атрибутов в пределах одной сущности;

- гарантия однозначной трактовки модели;

- должна быть выделена идентифицирующая совокупность атрибутов в каждой сущности;

- должна модель быть гибкой, т.е. при возникновении новых задач расширяться без существенных изменений существующей модели [11, 13, 20].

Почти все современные системы основаны на реляционной (relational) модели управления базами данных. В ней информация об объектах определенного вида представляется в табличном виде: в столбцах таблицы сосредоточены различные атрибуты объектов, а строки предназначены для сведения описаний всех атрибутов к отдельным экземплярам объектов [17-19].

Модель, созданная на этапе инфологического моделирования, в наибольшей степени удовлетворяет принципам реляционное™. Однако для приведения этой модели к реляционной необходимо выполнить нормализацию. В связи с эти, рациональные варианты концептуальной схемы базы данных должны удовлетворять третьей нормальной форме, а также следующим требованиям:

- выбранный перечень отношений должен быть минимален;

- отношение используется, если только его необходимость обусловлена задачами;

- выбранный перечень атрибутов должен быть минимален;

- атрибут включается в отношение только в том случае, если он будет использоваться [20].

В связи с этим, невозможно исключить ни один атрибут из идентифицирующей совокупности атрибутов, не нарушив при этом однозначной идентификации. Также, при выполнении операций над данными не должно возникать трудностей.

В свою очередь, даталогические и физические модели непосредственно реализуются в системе управления базами данных. При этом, конкретная система управления может включать в себя ограничения относительно наименования объектов базы данных, перечня поддерживаемых типов данных и т.п. Кроме того, специфика конкретной СУБД при физическом проектировании включает выбор решений, связанных с физической средой хранения данных, создание индексов и т.д.

На каждом уровне проектирования проводится структуризация информации таким образом, чтобы на третьем уровне информация могла быть представлена в виде структур данных, реализуемых в памяти электронно-вычислительной машины [11].

Поэтому было принято решение отказаться от проектирования базы данных по функциональному назначению. Считаем, более рациональным и эффективным проектирование базы данных таким способом, что вся информация собиралась вокруг клиента и хранилась физически в одной базе данных (рис. 3).

ВДМКБ

Классификация oojicihii

БД продуктов шгтапня

Калорийность

Белок

Жиры

Углеводы

Минер а льные элементы

Иптампны

Жирные кисло ты

Аминокислоты

Алкоголь

Кофеин

БД клиентов

Паспортные да иные

Биометрические данные

Лекарственные назначения

Лабораторные исследования

Аллергические реакции

Хронические чаосаеяантш

Обрач Ж1ПНП

Операции

Пишсвыс ирелночгсмия

БД медика мен i он

Склад лекарственных препаратов

Формуляр

Лекарственные формы

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Упаковки

Поставщики

БД графических файлов

Графические нхшрнжеиш Idem, jpg, brnp)

Видеофайлы (an, mpg)

Звуковые файлы (wav, rap?)

1

Рис. 3. Укрупненная схема объектно-реляционной базы данных информационной системы

врача-нутрициолога

Проектирование таким образом позволит достичь стабильно малого объема базы данных в течение практически всего срока ее эксплуатации. В конечном счете это обеспечит максимальную производительность работы информационной системы врача-нутрициолога. Сложностью указанной методики состоит в том, что подходит для этого только то программное обеспечение информационной системы, которое поддерживает любое количество физических баз данных в ядре системы, объединенных в одну логическую структуру. Для решения обозначенной задачи следует исключить в текстах программ информационной системы прямое обращение к базам данных, а использовать сервисы middleware (рис. 4) [11].

При этом структуризация данных по каждому клиенту врача-нутрициолога базируется на концепциях «агрегации» и «обобщения» [21-25]. Согласно схеме прохождения запроса к базе данных (обозначения на рис. 4):

1. Пользователь посылает СУБД запрос на получение данных из базы данных.

2. Проводится анализ прав пользователя и внешней модели данных (подтверждение или запрет доступа пользователя к запрошенным данным).

3. В случае запрета на доступ к данным СУБД сообщает пользователю об этом (стрелка 12) и прекращает дальнейший процесс обработки данных, в противном случае СУБД определяет часть концептуальной модели, которая затрагивается запросом пользователя.

4. СУБД получает информацию о запрошенной части концептуальной модели.

5. СУБД запрашивает информацию о местоположении данных на физическом уровне (файлы или физические адреса).

6. В СУБД возвращается информация о местоположении данных в терминах операционной системы (ОС).

7. СУБД запрашивает у ОС предоставление необходимых данных, используя средства ОС.

8. ОС осуществляет перекачку информации из устройств хранения и через СУБД пересылает ее в системный буфер (11).

9. ОС оповещает базу данных об окончании пересылки.

10. СУБД выбирает из доставленной информации, находящейся в системном буфере, только то, что нужно пользователю, и пересылает эти данные в системный буфер и в рабочую область пользова-

Рис. 4. Схема прохождения запроса к базе данных

Таким образом, реализованная на основе предложенной модели база данных позволит освоить управление ресурсами при организации диагностическо-консультативного процесса оказания медицинских услуг врачом-нутрициологом, усовершенствовать навыки выявления и предупреждения ее дефектов, связанных с ошибками включения в рацион «неподходящих» продуктов питания.

Работа выполнена при поддержке гранта Президента РФ по государственной поддержке ведущих научных школ РФ (грант НШ-122.2022.1.6).

Список литературы

1. Голосовский М.С., Юдин А.Б., Медведев В.Р., Васягин С.Н., Евтушенко Е.В. Алгоритм настройки нечеткого логического вывода в медицинских информационных системах, основанных на знаниях // Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение. 2021. Т. 11. № 4. С. 196-211.

2. Зарубина Т.В. Актуальные вопросы внедрения информационных технологий в здравоохранении // Вестник Росздравнадзора. 2018. № 3. С. 20-25.

3. Максимов И.Б., Столяр В.П., Богомолов А.В. Прикладная теория информационного обеспечения медико-биологических исследований. М: Бином, 2013. 311 с.

4. Стародубов В.И., Сидоров К.В., Зарубина Т.В. Оценка уровня информатизации медицинских организаций на этапе создания единого цифрового контура в здравоохранении // Вестник Росздравнадзора. 2020. № 3. С. 20-27.

5. Тутельян В.А., Мусина О.Н., Балыхин М.Г., Щетинин М.П., Никитюк Д.Б. Цифровая нутри-циология: применение информационных технологий при разработке и совершенствовании пищевых продуктов. М: Азбука, 2020. 378 с.

6. Гавриков М.Б., Кислицын А.А., Орлов Ю.Н., Камбаров А.О., Никитюк Д.Б., Тутельян В.А. Цифровая персонифицированная нутрициология: проблемы и решения. Препринты ИПМ им. М.В. Келдыша. 2020. № 25. 36 с.

7. Гмошинский И.В. Нутрициология (наука о питании): история, проблемы, перспективы. -URL: http://prez.ysn.ru (дата обращения: 20.03.2022).

8. Хидешели А.Г., Агапкин А.М. Перспективы развития нутрициологии в РФ // Академическая публицистика. 2021. № 3. С. 51-54.

9. Пивоварова О.А., Аксенова Е.И., Камынина Н.Н. Анализ глобальных исследовательских направлений в медицине (обзор литературы) // Здравоохранение Российской Федерации. 2021. Т. 65. № 5. С. 477-484.

10. Хлопотов Р.С. Анализ трендов медицинской информатики // Фундаментальные и прикладные проблемы техники и технологии. 2022. № 3. С. 135-147.

11. Абдуманонов А.А., Алиев Р. Э., Карабаев М. К., Хошимов В.Г. О проектировании медицинских баз данных и информационных систем для организации и управления лечебно-диагностических процессов // T-Comm: Телекоммуникации и транспорт. 2016. Том 10. №1. С. 45-53.

12. Бойко В.В., Савинков В.М. Проектирование баз данных информационных систем. М.: Финансы и статистика, 1989. 351 с.

13. Ветошкин В.М., Саяпин О.В. Методика построения концептуальной информационной модели организационной системы // Известия ЮФУ. Технические науки. 2013. № 3. С. 250-255.

14. Денисенко Д.Н., Максюта Н.В. Автоматизация планирования диетического питания // Вестник Национального технического университета Харьковский политехнический институт. Серия: Информатика и моделирование. 2009. № 13. С. 46-52.

16. Карпова И.П. Базы данных. М.: Питер, 2013. 240 с.

17. Осипов Д.Л. Технологии проектирования баз данных. М.: ДМК Пресс, 2019. 498 с.

18. Зингерман Б.В., Емелин И.В., Лебедев Г.С. Проблемы определения ключевых терминов медицинской информатики // Информационные технологии в медицине 2009-2010: тематический научный сборник. М.: Радиотехника, 2010. С. 20-33.

19. Попова-Коварцева Д.А., Сопченко Е.В. Основы проектирования баз данных. Самара: Изд-во Самарского университета, 2019. 112 с.

20. Проектирование баз данных. Основы проектирования реляционных баз данных. Национальный открытый университет «Институт»: официальный сайт. [Электронный ресурс] URL: http://www.intuit.ru/studies/professional retraining/953/courses/191/info (дата обращения: 02.05.2022).

21. Тобин Д.С., Голосовский М.С., Богомолов А.В. Технология обеспечения достоверности информации при проведении сетевых экспертиз // Современные информационные технологии и ИТ-образование. 2020. Т. 16. № 3. С. 623-632.

22. Ушаков И.Б., Богомолов А.В. Информатизация программ персонифицированной адаптационной медицины // Вестник Российской академии медицинских наук. 2014. Т. 69. № 5-6. С. 124-128.

23. Kirk D., Catal C., Tekinerdogan B. Precision nutrition: A systematic literature review // Computers in Biology and Medicine. 2021. Vol. 133. No 6. P. 104365. doi: 10.1016/j.compbiomed.2021.104365. Epub 2021 Apr 7.

24. Богомолов А.В. Информационные технологии цифровой адаптационной медицины // Информатика и автоматизация. 2021. Т. 20. № 5. С. 1154-1182.

25. Дейт К.Дж. Введение в системы баз данных. М.: Вильямс, 2005. 1327 с.

Хлопотов Роман Сергеевич, научный сотрудник, gniiivm-h@;yandex. ru, Россия, Санкт-Петербург, Санкт-Петербургский Федеральный исследовательский центр Российской академии наук

FEATURES OF DATABASE DESIGN FOR THE AUTOMATED WORKSTATION OF A NUTRITIONAL DOCTOR

R.S. Khlopotov

The article presents the results of the argumentation of the list of information necessary for the development of a personalized diet that meets the requirements of nutrition and dietology. As a result of the analysis of the generated list, the composition of the database complex is substantiated, the presence of which will allow adequately implementing the functionality of the automated workplace of a nutritionist.

Key words: digital nutrition, systems engineering, software engineering, dietary planning system, medical informatics, database, database management system.

Khlopotov Roman Sergeevich, researcher, gniiivm-h@yandex.ru, Russia, Saint-Petersburg, Saint-Petersburg Federal Research Center of the Russian Academy of Sciences

i Надоели баннеры? Вы всегда можете отключить рекламу.