Научная статья на тему 'Разработка систем индексации данных для производственно-экономического и трудового секторов пенитенциарной системы'

Разработка систем индексации данных для производственно-экономического и трудового секторов пенитенциарной системы Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
3
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
базы данных / индексация / ORM / SQL / Python / производственный сектор / экономические показатели / пенитенциарная система

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Д С. Пономарев

Разработка систем бизнес-аналитики, принятия решений и планирования ресурсов является одной из важнейших составляющих практически любого предприятия. В данном случае, предприятия и производства пенитенциарной системы не являются исключением. В работе рассмотрена проблема взаимосвязи существующих баз данных и статистических отчетных форм производственно-экономического и трудового секторов пенитенциарной системы. Установлено, что косвенно-взаимосвязанные параметры достаточно трудно сопоставить из-за разных систем учета данных, а также утвержденных статистических форм. Одной из первых ступеней в решении поставленной проблемы может стать введение обобщенной системы индексации данных. В работе рассмотрены системы индексации данных, построение их иерархических структур, а также возможность практического применения с использованием SQL. Рассмотрены примеры реализации при помощи технологии ORM и языка Pyhton.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Разработка систем индексации данных для производственно-экономического и трудового секторов пенитенциарной системы»

Разработка систем индексации данных для производственно-экономического и трудового секторов пенитенциарной системы

Д. С. Пономарев

Научно-исследовательский институт Федеральной службы исполнения наказаний,

г. Москва

Ижевский государственный технический университет имени М.Т. Калашникова,

г. Ижевск

Аннотация: Разработка систем бизнес-аналитики, принятия решений и планирования ресурсов является одной из важнейших составляющих практически любого предприятия. В данном случае, предприятия и производства пенитенциарной системы не являются исключением. В работе рассмотрена проблема взаимосвязи существующих баз данных и статистических отчетных форм производственно-экономического и трудового секторов пенитенциарной системы. Установлено, что косвенно-взаимосвязанные параметры достаточно трудно сопоставить из-за разных систем учета данных, а также утвержденных статистических форм. Одной из первых ступеней в решении поставленной проблемы может стать введение обобщенной системы индексации данных. В работе рассмотрены системы индексации данных, построение их иерархических структур, а также возможность практического применения с использованием SQL. Рассмотрены примеры реализации при помощи технологии ORM и языка Pyhton.

Ключевые слова: базы данных, индексация, ORM, SQL, Python, производственный сектор, экономические показатели, пенитенциарная система.

На сегодняшний день учет статистических данных является важной задачей для практически любого крупного производственного предприятия. И производственные предприятия пенитенциарной системы в данном вопросе не являются исключением [1]. Для производственно-экономического сектора пенитенциарной системы сбор и учет информации закреплен утвержденными ведомственными статистическими формами (Приказ ФСИН России №754 от 30.08.2019). Помимо учета статистической информации для производственно-экономического сектора, в уголовно-исполнительной системе существуют и другие формы учета данных, которые затрагивают непосредственно спецконтингент: показатели медицинского обеспечения, социальных показателей и общей характеристики спецконтингента (учет данных показателей ведется согласно Приказу ФСИН России №1033 от

Введение

12.11.2019; Приказу ФСИН России №661 от 15.09.2020; Приказу ФСИН России от 01.08.2014 № 398).

Первая проблема здесь состоит в том, что учтенные данные в целом недостаточно изучены: на сегодняшний день отсутствуют какие-либо утвержденные и внедренные методы и методики прогноза, поддержки принятия решений, автоматизации производственной деятельности в пенитенциарной системе на основе полученных знаний. Таким образом, собранные данные представляют интерес как с практических позиций организации и поддержания производственно-трудовой и экономической деятельности, так и с научной точки зрения. Однако, здесь стоит отметить, что данные разработки достаточно активно ведутся в научно-исследовательских подразделениях пенитенциарной системы [2, 3] в сотрудничестве с территориальными органами и медико-санитарными частями [4]. Второй проблемой является отсутствие каких-либо попыток связать данные между разными статистическими формами. Например, отсутствуют какие-либо научные обоснования взаимосвязи характеристик трудоустроенного спецконтингента и показателей медицинского обеспечения, социальных показателей и общей характеристикой спецконтингента пенитенциарных учреждений.

Таким образом, представляется актуальным разработка систем и алгоритмов сопоставления баз данных. Актуальным также представляется создание новых баз данных, использование которых будет направлено непосредственно на решение проблем прогноза, поддержки принятия решений и автоматизации производственной деятельности. Применение основ реляционной теории и разработки систем индексации [5, 6] может явиться первой ступенью в решении поставленных задач. Рассмотрим более подробно возможную систему индексации данных и ее структуры.

Разработка системы индексации

Для индексации данных были определены группы учета: X - данные, отражающие значения параметров и показателей согласно приведенным ранее Приказам; У - срезы, которые можно осуществить относительно X; временной срез учитывается отдельно и обозначен I.

Для X было принято обозначение: Хт,р,о, где т - индекс номера формы учета; р - индекс номера раздела в форме учета данных; о - индекс номера параметра в разделе. Для т=1 будет соответствовать форма ОТАО-1 (то есть отчеты о трудовой адаптации); т=2 соответственно форма ОТАО-2 (отчеты по производственной и экономической деятельности); т=3 - форма ФСИН-1 (что соответствует статистическим отчетам по итогам деятельности учреждений); m=4 - соответствует форме ФСИН-6, которая отражает сведения о социально-значимых заболеваниях. Исходя из т, далее можно выбрать один из разделов (что будет соответствовать индексу р). Для т=1 будет справедливо: р=1 - сведения о привлечении спецконтингента к трудовой адаптации; р=2 - заработная плата спецконтингента; р=3 -возмещение причиненного ущерба; р=4 - нормирование труда; р=5 -сведения о наличии и составе спецконтингента (трудовых ресурсов); р=6 -сведения о фактической численности и фонде заработной платы производственного персонала; р=7 - сведения о трудовой адаптации спецконтингента в отраслевом разрезе. Для т=2 значения р будут: р=1 -производственная и экономическая деятельность учреждений уголовно -исполнительной системы; р=2 - производственная и экономическая деятельность в отраслевом разрезе. Для т=3: р=1 - сведения о количестве учреждений, исполняющих уголовные наказания в виде лишения свободы, СИЗО и характеристике содержащихся в них лицах. Для т=4: р=1 - еведения о социально значимых заболеваниях у лиц, содержащихся в учреждениях уголовно-исполнительной системы Российской Федерации; р=2 - сведения

и

об отдельных показателях деятельности медицинской службы. Таким образом, будут получены следующие условия (1-4). Для X при т=1 будет справедливо условие (1):

Х-т=1

для X при т=2 (2):

Х-т=2

для X при т=3 (3):

ф = 1 => о е {1,2,. .,21}

Р = 2 => О е {1,2,. .,40}

V = 3 => о е {1,2,. .,36}

р = 4 => о е {1,2,. ,

V = 5 => о е {1,2,. .,23}

V = 6 => о е {1,2,. .,8}

1р = 7 => о е {1,2,. .,24}

|Р = = 1 => о е {1,2,.. .,61}

[р = 2 => о е {1,2,.. ., 3 7 Г

(1)

(2)

(3)

=3 =>р = 1 ,ое{ 1 , 2 1 5 9 },

для X при т=4 (4):

Гр = 1 => о Е {1,2,...,81} т=4 ^Чр = { 1 , 2 ,..., 4 8 }•

Представленная система индексации для X имеет иерархическую

структуру (рисунок 1).

(4)

Рис. 1. - Структура индексов для исследуемых параметров

Аналогичным образом введем индексацию для срезов по представленным параметрам и обозначим ее Уи,у: где и - срез по учреждениям (и=1, 3, 4) или отраслям производства (и=2), V - объект одного из выбранных

и

срезов (учреждение или отрасль производства). Тогда, для У, будет справедливо следующее (5-8):

И = 1 =>т;е{ 1 , 2,. . .,1 4} , (5)

, (6)

, (7)

. (8)

Для срезов по учреждениям будут характерны группы ,

им будут соответствовать группы параметров ;

^ш =2 ,р=1 , об{ 1 , 2 , . . . 6 1 } ; ^ш=3 ,р=1 , о 6 { 1 , 2 , . . ., 1 5 5 ^ш=4,р = 1 , об { . . .}. Срезы по отраслям

производства можно охарактеризовать одной большой группой , для которой будут соответствовать ;

. Структура индексов для У представлена на рисунке 2.

Рис. 2. - Структура индексов для возможных срезов параметров

Для времени ? вместо индексации следует рассмотреть промежутки учета данных: за месяц, квартал или год. Учет данных за месяц:

, квартал , год

. Структура индексации данных представлена на рисунке 3.

и

Рис. 3. - Структура индексов для периодов учета данных производственно-

экономического и трудового секторов

Таким образом, у нас получена многомерная система индексации, благодаря которой возможно как записывать, так и извлекать нужные данные, рассматривать срезы, масштабировать информацию. Далее рассмотрим практический пример применения данной системы индексации.

Практический пример использования и ORM

Предположим, что нужно извлечь данные по среднесписочной численности работников, которые проходят трудовую адаптацию в августе 2021 года в исправительных колониях. Представленный запрос будет выглядеть следующим образом (9):

^ш=1,р=1,о=1 Л YU=1V=4 Л ^08.2021 (9)

Если использовать пример извлечения данных на Python, то здесь в первую очередь следует руководствоваться правилами документа PEP8, т.е. названия индексов в виде переменных можно представить как: X111; Y14; t8_2021. Применив язык запросов баз данных SQL [7, 8] и ORM (Object-Relational Mapping) [9, 10] библиотеки, такие как SQLAlchemy, данный запрос можно реализовать следующим образом (рисунок 4).

sql query = text("SELECT * FROM your_table WHERE X = :x AND Y = :y AND date_column = :date")

Рис. 4. - Пример использования системы индексации на Python с использованием библиотеки SQLAlchemy

В результате, представленную систему индексации данных возможно использовать не только на теоретическом уровне, но и с позиции практического применения. Использование ORM, а также запросов SQL, здесь может быть хорошим решением для дальнейшей практической реализации.

Заключение

Приведенные структуры и система индексации данных достаточно хорошо укладываются в парадигму объектно-ориентированного подхода. Используя приведенную систему индексов на языке SQL, можно оптимизировать извлечение и запись информации в базах данных. Также здесь особенно актуально использование ORM и сопутствующих библиотек.

Все это позволит создавать более структурированные базы данных, с возможностью более быстрой записи и чтения информации, а также более удобной работы с данными в целом. Актуальным продолжением представленной разработки может явиться проведение классового распределения исследуемых данных и создание KPI (Key Performance Indicators), разработка ER-моделей и OLAP-кубов для практического применения на производствах.

Литература

1. Пономарев Д.С. Разработка алгоритмов обработки временных рядов при работе с статистическими отчетными формами производственного сектора пенитенциарной системы // Инженерный вестник Дона, 2024, №2. URL: ivdon.ru/ru/magazine/archive/n2y2024/9029

2. Царькова Е.Г. Методы поддержки принятия решений в деятельности органа исполнительной власти по обеспечению надежности ведомственной информационной среды // Инженерный вестник Дона, 2022, № 7. URL: ivdon.ru/ru/magazine/archive/n7y2022/7814.

3. Царькова Е.Г. Математическая модель управления надежностью системы интеллектуального видеонаблюдения на охраняемых объектах уголовно-исполнительной системы // Инженерный вестник Дона, 2022, № 8. URL: ivdon.ru/ru/magazine/archive/n8y2022/7854.

4. Пономарев С.Б., Горохов М. М., Серебренников А. В., Логинова С. Г. К вопросу о применении информационных систем для оптимизации тактики ведения больных в местах лишения свободы// Интеллектуальные системы в производстве, 2007. №2. С. 100-103.

5. Тененев В.А., Пономарев С.Б., Сергиенко А.С., Тоцкий С.И. Исследование критерия эффективности медицинского обслуживания для оптимизации сети медицинских частей учреждений территориального органа ФСИН России// Интеллектуальные системы в производстве, 2007. № 1(9). С.85-99.

6. Date C.J. SQL and Relational Theory. O'Reilly. 2010. 474 p

7. Кара-Ушанов В.Ю. SQL - язык реляционных баз данных. УрФУ, 2016.— 156 с.

8. Walter Shields SQL Quick Start Guide // Clyde Bank technology. 2022. 223 p.

9. Lutz M. Learning Python // 5th Edition Vol.1 O'Reilly, 2019. 832 p.

10. Cory Althoff. The Self-Taught Computer Scientist: The Beginner's Guide to Data Structures & Algorithms // Wiley, 1st edition. 2021. 224 p.

References

1. Ponomarev D.S. Inzhenernyj vestnik Dona, 2024, №2. URL: ivdon.ru/ru/magazine/archive/n2y2024/9029

2. Czarkova E.G. Inzhenernyj vestnik Dona, 2022, № 7. URL: ivdon.ru/ru/magazine/archive/n7y2022/7814

3. Czarkova E.G. Inzhenernyj vestnik Dona, 2022, № 8. URL: ivdon.ru/ru/magazine/archive/n8y2022/7854

4. Ponomarev S.B., Gorochov M. M., Serebrennikov A. V., Loginova S. G. Intellektual'ny'e sistemy' v proizvodstve, 2007. №2. pp. 100-103.

5. Tenenev V.A., Ponomarev S.B., Sergienko A.S., Toczkij S.I. Intellektuafny'e sistemy' v proizvodstve, 2007. № 1(9). pp. 85-99.

6. Date C.J. SQL and Relational Theory. O'Reilly. 2010. 474 p.

7. Kara-Ushanov V. Yu. SQL - yazyk relyacionny'x baz dannyx [SQL - relational database language]. UrFU, 2016. 156 p.

8. Walter Shields SQL Quick Start Guide. Clyde Bank technology. 2022.

223 p.

9. Lutz M. Learning Python. 5th Edition Vol. 1 O'Reilly, 2019. 832 p.

10. Cory Althoff. The Self-Taught Computer Scientist: The Beginner's Guide to Data Structures & Algorithms. Wiley, 1st edition. 2021. 224 p.

Дата поступления: 27.01.2024 Дата публикации: 7.03.2024

i Надоели баннеры? Вы всегда можете отключить рекламу.