Научная статья на тему 'Подходы к разработке региональной информационной системы расчёта показателей мониторинга системы образования'

Подходы к разработке региональной информационной системы расчёта показателей мониторинга системы образования Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
67
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МОНИТОРИНГ СИСТЕМЫ ОБРАЗОВАНИЯ / ИНФОРМАЦИОННЫЕ СИСТЕМЫ / ФОРМЫ ФЕДЕРАЛЬНОГО СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ / АВТОМАТИЗАЦИЯ РАСЧЁТА ПОКАЗАТЕЛЕЙ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бенко Е.В., Ершов Д.А.

В статье обосновывается актуальность разработки региональной информационной системы расчёта показателей мониторинга системы образования. Выделены основные затруднения, возникающие в ходе ручного расчёта показателей на региональном и муниципальном уровнях. Определены ключевые подходы к автоматизации расчетов и функции разрабатываемой системы. В статье также описаны предполагаемые преимущества и ограничения будущей системы, определены направления дальнейшей разработки и перспективы развития.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Бенко Е.В., Ершов Д.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Подходы к разработке региональной информационной системы расчёта показателей мониторинга системы образования»

ПОТЕНЦИАЛ ИНФОРМАЦИОННЫХ СИСТЕМ И ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ В ОБРАЗОВАНИИ

УДК 37.012:004

ПОДХОДЫ К РАЗРАБОТКЕ РЕГИОНАЛЬНОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ РАСЧЁТА ПОКАЗАТЕЛЕЙ МОНИТОРИНГА СИСТЕМЫ

ОБРАЗОВАНИЯ

Е.В. Бенко, Д.А. Ершов

В статье обосновывается актуальность разработки региональной информационной системы расчёта показателей мониторинга системы образования. Выделены основные затруднения, возникающие в ходе ручного расчёта показателей на региональном и муниципальном уровнях. Определены ключевые подходы к автоматизации расчетов и функции разрабатываемой системы. В статье также описаны предполагаемые преимущества и ограничения будущей системы, определены направления дальнейшей разработки и перспективы развития.

Ключевые слова: мониторинг системы образования, информационные системы, формы федерального статистического наблюдения, автоматизация расчёта показателей.

Функционирование и развитие системы образования невозможно без детального анализа ее текущего состояния. Знание и понимание ключевых особенностей и проблем актуального состояния являются обязательным условием для формирования региональной политики в сфере образования и принятия соответствующих управленческих решений. В связи с этим, анализ должен осуществляться систематически, в соответствии с установленными критериями и основываться на достоверных данных.

Начиная с 2013 года одним из инструментов непрерывного системного наблюдения и анализа состояния системы образования является мониторинг системы образования [4]. Мониторинг системы образования (далее - мониторинг) представляет собой систематическое стандартизированное наблюдение за состоянием образования и динамикой изменений его результатов, условиями осуществления образовательной деятельности, контингентом обучающихся,

учебными и внеучебными достижениями обучающихся, профессиональными достижениями выпускников организаций, осуществляющих образовательную деятельность, состоянием сети организаций, осуществляющих образовательную деятельность [3, ст. 97 п. 3].

Показатели мониторинга рассчитываются в соответствии с утвержденной методикой. Расчёт большинства из них осуществляется на основе данных федерального статистического наблюдения, достоверность которых обеспечивается на муниципальном и региональном уровнях.

Для мониторинга используются сведения из следующих форм федерального статистического наблюдения:

Форма № 85-К «Сведения о деятельности организации, осуществляющей образовательную деятельность по образовательным программам дошкольного образования, присмотр и уход за детьми» (Приказ Росстата от 18.07.2019 № 410 (ред. от 10.09.2019));

Форма № ОО-1 «Сведения об организации, осуществляющей образовательную деятельность по образовательным программам начального общего, основного общего, среднего общего образования» (Приказ Росстата от 12.08.2019 № 441 (ред. от 30.08.2019));

Форма № ОО-2 «Сведения о материально-технической и информационной базе, финансово -экономической деятельности общеобразовательной организации» (Приказ Росстата от 01.11.2019 № 648 (ред. от 05.12.2019));

Форма № 1-ДО «Сведения об учреждении дополнительного образования детей» (Приказ Росстата от 14.01.2013 № 12 (ред. от 23.12.2016));

Форма № 1-ДОП «Сведения о дополнительном образовании детей» (Приказ Росстата от 18.07.2019 N 410 (ред. от 10.09.2019));

Форма № СПО-1 «Сведения об образователь-

ной организации, осуществляющей образовательную деятельность по образовательным программам среднего профессионального образования» (Приказ Росстата от 16.08.2019 № 455).

Форма № СПО-2 «Сведения о материально-технической и информационной базе, финансово-экономической деятельности профессиональной образовательной организации» (Приказ Росстата от 01.11.2019 № 648 (ред. от 05.12.2019);

Форма № 1-ПК «Сведения о деятельности организации, осуществляющей образовательную деятельность по дополнительным профессиональным программам» (Приказ Росстата от 20.12.2019 № 786).

На сегодняшний день расчёт показателей осуществляется самостоятельно специалистами органов исполнительной власти субъектов Российской Федерации и органов местного самоуправления, осуществляющих управление в сфере образования. Расчёт является весьма трудоёмким и занимает достаточно большой объём времени, вследствие чего особо актуальной задачей становится обеспечение автоматизации сбора и хранения форм федерального статистического наблюдения с последующим расчётом всех необходимых показателей мониторинга на их основе.

Создание и эксплуатация региональных информационных систем, функционирование информационных систем в муниципальных образовательных системах и в образовательных организациях, а также накопление, хранение и массовое применение баз данных является одним из приоритетных направлений информатизации управления качеством образования Челябинской области [2, с. 18]. Однако полноценный сбор и хранение всех форм статистической отчётности посредством информационных систем на сегодняшний день, к сожалению, сложно реализуемы ввиду различных объективных затруднений. Это и наличие в системе личных кабинетов не всех филиалов и структурных подразделений, отличие финальных сводных форм от форм предоставления первичных данных, невозможность оперативного обновления форм статистического наблюдения в системе, отсутствие бесперебойно-

го доступа в сеть «Интернет» у некоторых образовательных организаций [1, с. 96]. В связи с этим, на данном этапе цифровизации реализация полностью автоматизированного расчёта показателей мониторинга системы образования посредством уже существующих информационных систем становится невозможной.

При этом отмечается явная потребность в выполнении данного расчёта автоматизировано в силу целого ряда причин. Во-первых, это снижение нагрузки на специалистов органов местного самоуправления, осуществляющих управление в сфере образования. Расчёт показателей вручную занимает довольно продолжительное время вследствие большого объёма как исходных данных, необходимых для анализа, так и непосредственно количества самих показателей (118 показателей и 277 рассчитываемых значений). Отдельно следует уточнить, что формулы ряда показателей являются многосоставными, сложными для понимания и требующими наличия данных из разных источников информации. В результате полный расчёт всех показателей может занимать от нескольких дней до нескольких недель, а специалисты, осуществляющие расчёт, должны быть обучены этому.

Вторая причина касается регулярного обновления методики расчёта показателей, в результате чего некоторые из них удаляются, добавляются или меняются в части формул. В таком случае осуществлять расчёт заранее становится нецелесообразным, а обновленные показатели требуют детального изучения и уточнения в части расчётов, что лучше делать централизованно.

Вследствие вышесказанного, мы подходим к третьей важной причине - снижение количества ошибок в силу человеческого фактора. Сложность расчёта ряда показателей, их регулярное изменение и некомпетентность отдельных специалистов неизбежно приводят к ошибкам. При этом, в связи с тем, что расчёт осуществляется достаточно большим количеством специалистов как из разных муниципальных образований, так и, вероятно, внутри одного муниципального образования, вероятность возникновения ошибок лишь возрастает. Это ещё раз подчёркивает потребность в централизации расчёта показате-

лей мониторинга.

Централизация позволяет отметить и все внесенные изменения и избежать разрозненности трактовок касательно тех или иных расчётов. Однако, при централизации расчёта возрастает также и нагрузка на специалистов, его осуществляющих. Общее количество показателей в разрезе 43 муниципальных образований Челябинской области составляет более десяти тысяч. Следует также указать на то, что среди них есть такие, которые подразумевают необходимость обработки исходного файла каждой образовательной организации вручную для отнесения ее к определенному признаку (например, имеет все виды благоустройств). Таким образом, расчёт одного показателя может сводиться к необходимости в открытии и анализе полутора тысяч файлов образовательных организаций. Всё это неизменно требует затрат больших временных ресурсов, и опять же приводит нас к вопросу наличия ошибок в силу человеческого фактора.

Таким образом, потребность в снижении человеческих и временных ресурсов, необходимость в сокращении ошибок, а также регулярное обновление методики обусловили необходимость в разработке локальной региональной информационной системы расчёта показателей мониторинга системы образования.

Основными функциями, которыми должна обладать система в таком случае, становятся:

функция обработки данных (автономно захватывать все необходимые для расчёта каждого конкретного показателя сведения из исходных и/или сводных файлов и производить корректные расчёты);

функция формирования статистического отчёта.

На ранних этапах разработки мы отказались от

00-1

Папки муниципалитетов с исходными файлами

Исходные файлы школ

П-1

Своды I-*

= о

функции хранения данных в силу целого ряда причин. Во-первых, это объём исходных данных - около 3-4 тысяч файлов общим весом в несколько гигабайт. Создание системы, способной хранить такие объёмы данных, на сегодняшний день не является актуальной задачей в связи с тем, что это будет дублированием уже существующих систем, а также затребует на создание гораздо больших ресурсов. Во-вторых, система изначально разрабатывается для внутреннего пользования, что подводит нас к отсутствию необходимости вывода информации для других пользователей. И, в-третьих, хранение подобного объёма информации подразумевает также необходимость обеспечения информационной безопасности, поскольку первичные статистические данные могут содержать сведения, составляющие государственную и коммерческую тайны, сведения о налогоплательщиках, о персональных данных физических лиц, которые не должны разглашаться, распространяться и использоваться не в целях формирования официальной статистической информации [5, п. 14 и 15]. Это также лишь усложнит и замедлит работу над системой.

Из этого следует, что для полноценного функционирования системы необходимо использовать определенные сведения из хранящихся на компьютере баз данных. Обязательным условием работы системы в таком случае становится предварительная подготовка структуры каталогов и подкаталогов, в которых содержатся файлы. Поскольку расчёт показателей осуществляется как по региону в целом, так и по отдельным муниципальным образованиям, а ряд показателей рассчитывается только по исходным файлам, то было принято решение организовать систему хранения файлов следующим образом (рисунок 1).

Сводные файлы по муниципалитетам

Сводный файл по региону

Рис. 1 - Структура каталогов и подкаталогов

для взаимодействия с региональной информационной системы расчёта показателей мониторинга системы образования

Аналогичным способом, представленным на рисунке 1, организуется система хранения всех файлов других форм статистической отчётности. При запуске Системы начинается процесс парсинга каталогов с последующим сохранением результатов в заданном отчёте. По сути, расчёт показателей по данным формам представляет собой своего рода цикл, в котором каждый раз открываются одни и те же подкаталоги, разделы формы, проверяются одни и те же графы и строки файлов, различие представляют лишь сами файлы.

Большинство исходных файлов и сводных форм хранятся в формате хкх, однако ряд файлов представлен в формате хт1 (форма № 85-к). В связи с тем, что файлы с разным расширением имеют разную структуру, процесс извлечения данных из них существенно различается. С точки зрения простоты извлечения формат хкх является более удобным, так как его структура довольно проста, и для извлечения информации необходимо указать лишь нужный лист и адрес ячейки, тогда как формат хт1 имеет древовидную структуру. Соответственно, чтобы извлечь значение из «дерева», необходимо совершить его обход в глубину, пока не будут достигнуты необходимые потомки связки «таблица-строка-столбец».

Главным преимуществом обработки хкх файлов является простая структура, а соответственно, довольно быстрое нахождение необходимых значений, что существенно отличается от процесса обработки хт1 файлов. В то же время, разница в размере файлов является довольно большой, файлы хкх занимают в сотни раз больше места, чем файлы хт1. Данный факт подводит к существенному недостатку обработки хкх файлов - времени их обработки. В связи с большой разницей в размере файлы хкх будут обрабатываться значительно дольше, чем файлы хт1. Например, цикличная обработка и извлечение нескольких значений из 1600 хт1 файлов занимает меньше минуты времени, тогда как обработка гораздо меньшего количества хкх файлов может занимать несколько десятков минут.

Таким образом, одной из трудностей при работе с системой может выступать машинное

время расчетов: для некоторых показателей требуется циклично обработать и обойти порядка 800 файлов весом около 1 мегабайта, что может занимать вплоть до нескольких часов ожидания. Вместе с тем, данная величина времени все равно значительно меньше, чем может быть затрачено на ручной расчет тех же показателей, что является безусловным преимуществом автоматизации расчётов.

Для наглядной демонстрации увеличения скорости расчетов можно привести пример одного из самых трудоемких показателей мониторинга, в котором требуется рассчитать удельный вес числа зданий организаций, обладающих всеми видами благоустройства, по отношению к общему количеству зданий. Расчет данного показателя в целом по Челябинской области требует проверки хт1 файлов всех организаций, осуществляющей образовательную деятельность по образовательным программам дошкольного образования, которых порядка 1600. Вручную данный показатель может рассчитываться вплоть до недели. Автоматизировав данную процедуру, было установлено, что затрачиваемое на подсчет показателя время составило всего 6 секунд.

Следующим достоинством системы является то, что выбранная структура может быть масштабирована в короткие сроки в случае увеличения количества показателей. Кроме того, при расчетах она потребляет сравнительно небольшое количество оперативной памяти, что позволяет использовать ее на абсолютно любом персональном компьютере, находящемся в организации.

Таким образом, описанные принципы работы системы позволяют довольно быстро производить расчеты всех необходимых показателей, однако в методику расчёта могут ежегодно вноситься изменения, вследствие чего необходимо каждый раз затрачивать неопределенное количество времени на отслеживание данных изменений для добавления/удаления показателей из системы.

В связи с этим, одной из перспектив дальнейшей работы над системой мы видим возможность рассмотрения автоматизации данного вида работ. Примером такой автоматизации может служить нейронная сеть, использующая технологии

компьютерного зрения. Предполагается, что данная сеть будет способна переводить страницы из pdf в изображения и распознавать текст на изображениях, вследствие чего сравниваются методики текущего и предыдущего годов и указываются различия в них. Проблемой в разработке подобной сети может являться отсутствие обучающего набора данных (в данном случае русских букв и математических символов) в достаточном количестве для обеспечения высокой точности.

Ещё одной перспективой работы мы видим расширение количества рассчитываемых показателей. На сегодняшний день в активной разработке находятся показатели мониторинга, содержащие сведения о развитии дошкольного образования, начального общего образования, основного общего образования и среднего общего образования, а также дополнительного образования детей и взрослых. В перспективе планируется рассмотреть возможность разработки расчёта показателей, содержащих сведения о развитии среднего профессионального образования и дополнительного профессионального образования.

Резюмируя всё вышесказанное, важно отметить, что в условиях активной цифровизации системы образования разработка информационных систем, направленных на дебюрократизацию учреждений различных уровней (регионального, муниципального, институционального), является одной из приоритетных задач. Разработка региональной информационной системы расчёта показателей мониторинга системы образования не только соответствует современным трендам политики в сфере образования, но также направлена и на повышение объективности предоставляемых данных. Нами были выделены следующие преимущества будущей системы:

- значительное сокращение временных ресурсов;

- модульность и, как следствие, масштабируемость системы;

- потребление сравнительно небольшого количество оперативной памяти;

- снижение ошибок в силу человеческого фактора;

- снятие нагрузки со специалистов муниципальных органов.

Среди существующих ограничений работы системы можно отметить:

- отсутствие функции хранения информации;

- необходимость формирования системы каталогов и подкаталогов на подготовительном этапе для корректной работы системы;

- расчёт не всех показателей;

- локальное использование.

В случае успешной апробации системы нами запланированы работы по расширению функционала, оптимизации работы в системе и увеличению удобства и наглядности интерфейса (например, добавление графического отображения прогресса процесса расчетов). Кроме того, планируется сократить количество существующих на сегодняшний день ограничений.

Список литературы

1. Бенко Е.В. Потенциал использования информационных систем для сбора и хранения форм федерального статистического наблюдения / Е.В. Бенко, С.В. Васютин // Научно-методическое обеспечение оценки качества образования. - 2019. - № 3(8). - C. 95-98.

2. Концептуализация информационной политики в системе образования Челябинской области / Т.А. Орехова, Т.Б. Белякова, Е.Н. Смирнова [и др.] // Научно-методическое обеспечение оценки качества образования. - 2019. - N° 1 (6). -С. 18-24.

3. Об образовании в Российской Федерации : Федеральный закон от 29.12.2012 г. № 273-Ф3 -URL: http://www.consultant.ru/document/cons_ doc_LAW_140174/ (дата обращения: 21.04.2020).

4. Об осуществлении мониторинга системы образования : постановление Правительства РФ от 50.08.2013 № 662 (ред. от 25.05.2019). - URL: https://legalacts.ru/doc/postanovlenie-pravitelstva-rfot-05082013-n-662/. (дата обращения: 21.04.2020).

5. Об условиях предоставления в обязательном порядке первичных статистических данных и административных данных субъектам официального статистического учета : постановление Правительства РФ от 18.08.2008 N 620 (ред. от 22.04.2015) - URL: http://www.consultant.ru/docu ment/cons_doc_LAW_79488/ (дата обращения: 20.04.2020).

References

1. Benko E.V. Potentsial ispol'zovaniya informatsionnykh sistem dlya sbora i khraneniya form federal'nogo statisticheskogo nablyudeniya / E.V. Benko, S.V. Vasyutin // Nauchno-metodicheskoe obespechenie otsenki kachestva obrazovaniya. -2019, № 3(8). - C. 95-98.

2. Kontseptualizatsiya informatsionnoy politiki v sisteme obrazovaniya Chelyabinskoy oblasti / T.A. Orekhova, T.B. Belyakova, E.N. Smirnova, D.A. Yugova, I.S. Borovykh // Nauchno-metodicheskoe obespechenie otsenki kachestva obrazovaniya. - 2019. - № 1 (6). - S. 18-24.

3. Ob obrazovanii v Rossiyskoy Federatsii : Federal'nyy zakon ot 29.12.2012 g. № 273-FZ -URL: http://www.consultant.ru/document/ cons_doc_LAW_140174/ (data obrashcheniya: 21.04.2020).

4. Ob osushchestvlenii monitoringa sistemy obrazovaniya : postanovlenie Pravitel'stva RF ot 50.08.2013 № 662 (red. ot 25.05.2019). - URL: https://legalacts.ru/doc/postanovlenie-pravitelstva-rfot-05082013-n-662/. (data obrashcheniya: 21.04.2020).

5. Ob usloviyakh predostavleniya v obyazatel'nom poryadke pervichnykh statisticheskikh dannykh i

administrativnykh dannykh sub"ektam ofitsial'nogo statisticheskogo ucheta : postanovlenie Pravitel'stva RF ot 18.08.2008 N 620 (red. ot 22.04.2015) - URL: http ://www. consultant.ru/ document/cons_doc_LAW _79488/. (data obrashcheniya: 20.04.2020).

Сведения об авторах

Бенко Елизавета Вячеславовна - кандидат психологических наук, начальник отдела образовательной статистики ГБУ ДПО «Региональный центр оценки качества и информатизации образования», г. Челябинск

Ершов Данил Алексеевич - статистик отдела образовательной статистики ГБУ ДПО «Региональный центр оценки качества и информатизации образования», г. Челябинск

Information about authors Benko E.V. - Candidate of Psychological Sciences, Head of the Department for Education Statistics, Regional Center for Quality Assessment and Informatization of Education, Chelyabinsk

Ershov D.A. - Statistician of the Department for Education Statistics, Regional Center for Quality Assessment and Informatization of Education, Chelyabinsk

УДК 004.56

ОБЕЗЛИЧИВАНИЕ КАК МЕТОД УЧЕТА ОБУЧАЮЩИХСЯ В ИНФОРМАЦИОННЫХ СИСТЕМАХ ОБРАЗОВАТЕЛЬНЫХ ОРГАНИЗАЦИЙ В СЛУЧАЕ ОТКАЗА ОТ ОБРАБОТКИ ПЕРСОНАЛЬНЫХ ДАННЫХ

Е.С. Мухаметьева, А.Б. Захаров

Статья посвящена актуальности обезличивания персональных данных как метода учета обучающихся в информационных системах. Рассматривается процедура обезличивания персональных данных в случае отказа от обработки персональных данных и отзыва такого согласия. Рассматривается метод введения идентификаторов, как один из самых удобных и эффективных методов обезличивания персональных данных в информационной системе.

Ключевые слова: отказ от обработки персональных данных, обезличивание персональных данных, согласие на обработку персональных данных, информационная безопасность.

Современные информационные технологии являются ключевым компонентом в системе образования. С развитием информатизации все больше внимания уделяется цифровому образованию и информационным системам. И вопросы, касающиеся защиты персональных данных в

i Надоели баннеры? Вы всегда можете отключить рекламу.