НАУЧНЫЙ ВЕСТНИК КРЫМА, № 5 (34) 2021 УДК 004.8:651.5:930.25
Лобанова Александра Михайловна, кандидат экономических наук, доцент, доцент кафедры Информационных технологий в юридической деятельности и документационного обеспечения управления Юридического института, Российский университет транспорта, г. Москва, Россия
e-mail: [email protected]
ЭКСПЕРТИЗА ЦЕННОСТИ ДОКУМЕНТОВ. СОВРЕМЕННЫЕ
ВЫЗОВЫ И ПЕРСПЕКТИВЫ ПРИМЕНЕНИЯ ИСКУССТВЕННОГО
ИНТЕЛЛЕКТА
Аннотация. В статье представлен анализ изменений, которые формируют задачи актуализации методологии и процедур экспертизы ценности документов. Предложено и обосновано разделение понятий экспертизы ценности документов, как общего понятия, и экспертизы ценности документов с целью отнесения документа к Архивному фонду Российской Федерации. С учетом проанализированных изменений уточнены базовые вопросы экспертизы ценности документов. Рассмотрены направления применения технологий искусственного интеллекта в управлении документацией и сформулированы задачи, которые должны быть решены с целью возможности применения систем искусственного интеллекта при проведении экспертизы ценности документов.
Ключевые слова: документоведение, инженерия знаний, искусственный интеллект, категоризация текстов, критерии экспертизы ценности документов, машинное обучение, систематизация документов, отбор документов на уничтожение, хранение документов, экспертиза ценности документов, экспертные системы, электронный документ.
Aleksandra Mikhailovna Lobanova, PhD (Economics), Docent, Associate
НАУЧНЫЙ ВЕСТНИК КРЫМА, № 5 (34) 2021 Professor of the Department of Information Technologies in Legal Activity and Records Management, Law Institute, Russian University of Transport, Moscow, Russia
e-mail: [email protected]
RECORDS APPRAISAL. MODERN CHALLENGES AND PROSPECTS FOR THE USE OF ARTIFICIAL
Annotation: the article presents an analysis of the changes that form the tasks of updating the methodology and procedures for records appraisal. The separation of the concepts of the records appraisal, as a general concept, and the records appraisal for the purpose of attributing the document to the Archival Fund of the Russian Federation is proposed and justified. Considering the analyzed changes, the basic issues of the records appraisal are clarified. The applications of artificial intelligence technologies in the records management are considered and the tasks that should be solved in order to be able to use artificial intelligence systems for the records appraisal are formulated.
Key words: artificial intelligence, digital record, document science, knowledge engineering, records retention, document systematics, expert system, machine learning, records appraisal, records appraisal criteria, records disposal, records retention, text categorization, unification, metadata, metamodel, records management, electronic interchange, digital document, digital record.
Развитие и трансформация социальной, политической, экономической сфер, совершенствование государственного и корпоративного управления формирует запросы на уточнение понятий и создание новых инструментов, как технологических, так и процедурных, даже в самых консервативных областях деятельности. Активизация развития прорывных технологий, формируемая государственной политикой, позволяет по-другому подходить к решению существующих задач. Экспертиза ценности документов (ЭЦД) - это один из
НАУЧНЫЙ ВЕСТНИК КРЫМА, № 5 (34) 2021 знаниемких разделов документоведения, требующий глубоких знаний истории и социальных наук, обладания структурно-аналитическими инструментарием, понимания особенностей происходящих изменений [1] и их влияние на методологию и процедуры ЭЦД, а также понимания риска ошибок в проведении экспертизы ценности документов для устойчивого развития организаций, государства и взаимоотношений различных субъектов. Специалисты и эксперты должны обладать высокой квалификацией, быть способными структурировать и формализовывать знания о ценности документов и риске их утраты. К сожалению, таких экспертов крайне мало, поэтому следует рассмотреть перспективы, которые дают технологии искусственного интеллекта для осуществления этой деятельности.
Говоря об экспертизе ценности документов и возможностях применения искусственного интеллекта, необходимо охарактеризовать существующее положение в этих областях, после чего можно определить возможные области пересечения.
Во-первых, нужно отметить, что понимание экспертизы ценности документов и акценты этой деятельности меняются, что находит отражение, как в принимаемых нормативно-методических документах, так и в научной дискуссии.
Традиционно экспертиза ценности документов рассматривалась как инструмент, позволяющий осуществить отбор на государственное хранение документов, соответственно, все теоретические и методологические разработки, а также положенные в их основу и основанные на них критерии экспертизы ценности документов и методики были подчинены этой цели. В соответствии с Федеральным законом от 22 октября 2004 г. N 125-ФЗ "Об архивном деле в Российской Федерации" под экспертизой ценности документов понимается изучение документов на основании критериев их ценности в целях определения сроков хранения документов и отбора их для включения в состав Архивного фонда Российской Федерации, при этом документом Архивного фонда Российской Федерации является архивный документа, удовлетворяющий
НАУЧНЫЙ ВЕСТНИК КРЫМА, № 5 (34) 2021 трем критериям: 1) документ прошел экспертизу ценности документов, 2) документ поставлен на государственный учет, 3) документ подлежит постоянному хранению. Если документ прошел экспертизу ценности документов, по результатам которой принято решение о том, что он подлежит постоянному хранению, но он не поставлен на государственный учет, то документ является архивным, но не относится к Архивному фонду Российской Федерации. Для проведения экспертизы ценности таких документов процедура экспертизы ценности и состав критериев могут отличаться.
Экспертиза ценности документов может проводится в организациях, не являющихся источниками комплектования государственных и муниципальных архивах, а также при отборе документов для различных частных коллекций, в том числе и коллекций и фондов общественных организаций и других организаций. По результатам такой экспертизы ценности документов, документ становится архивным, но не включается в Архивный фонд Российской Федерации.
Соответственно, как мы видим, существует и другое понимание «экспертизы ценности документов», которое отражено в ГОСТ Р 7.0.8-2013 «СИБИД. Делопроизводство и архивное дело. Термины и определения», и которое определяет эту деятельность как изучение документов на основании критериев их ценности для определения сроков хранения документов. В данном случае речь не идет ни о том, что он подлежит постоянному хранению, ни о том, что он должен быть поставлен на государственный учет.
Актуализированный в 2020 году стандарт Международной организации по стандартизации ISO 30300:2020(en) Information and documentation — Records management — Core concepts and vocabulary (Основные положения и словарь) дает определение экспертизе ценности документов, которое еще больше отходит от определения, закрепленного в Федеральным законом от 22 октября 2004 г. N 125-ФЗ "Об архивном деле в Российской Федерации". Здесь экспертиза ценности документов определена как анализ и оценка бизнес-функций и процессов, делового контекста и риска с целью определения
НАУЧНЫЙ ВЕСТНИК КРЫМА, № 5 (34) 2021 требований к документам1. Одним из таких требований является требование к срокам хранения.
Нужно отметить, что ГОСТ Р ИСО 30300-2015. Национальный стандарт Российской Федерации. Система стандартов по информации, библиотечному и издательскому делу. Информация и документация. Системы управления документами. Основные положения и словарь (утв. и введен в действие Приказом Росстандарта от 09.12.2015 N 2123-ст), который является адаптацией замененной версии стандарта ISO 30300-2011 года не содержит определения экспертизы ценности документов, как не содержит ее сам стандарт ISO 303002011.
В связи с этим имеет смысл разделить понятия экспертизы ценности документов с целью отнесения документа к Архивному фонду Российской Федерации и экспертизы ценности документов, проводимой в организации или, возможно, частным коллекционером. Уточнить формулировку названия экспертизы ценности документов при отборе в состав Архивного фонда Российской Федерации можно, к примеру, следующим образом: «экспертиза ценности документов с целью отнесения к Архивному фонду Российской Федерации». По мнению автора, нужно уточнить именно эту формулировку, поскольку, такая экспертиза ценности документов является частным случаем экспертизы ценности документов вообще.
Следующий фактор, который оказывает влияние на методологию и процедуры экспертизы ценности документов, это рост объема документов и появление, и активное внедрение в социально-культурную и хозяйственно-экономическую деятельность электронных документов [2], [3].
Нужно отметить, что в «Основных правилах работы архивов организаций» (2002) представлена специфика проведения экспертизы ценности электронных документов, в то время как в действующих Правилах [4], регулирующих работу по хранению документов в организациях, заложен единый подход к экспертизе ценности документов вне зависимости от их
1 Перевод автора.
ISSN: 2499-9911 5
НАУЧНЫЙ ВЕСТНИК КРЫМА, № 5 (34) 2021 формата и носителя, что с концептуальной точки зрения оправдано, но на практике, как отмечают специалисты: «немногие организации вносят электронные документы в свои номенклатуры», поскольку работники, отвечающие за составление номенклатур дел в подразделениях и в организации в целом, затрудняются идентифицировать такую документированную информацию, как документы и дела, которые необходимо вносить в номенклатуру дел и рассматривать как объекты экспертизы ценности документов, поскольку «отсутствует механизм выявления ценной электронной документации на этапе делопроизводства и другого их оперативного использования» [5].
По мнению специалистов-архивистов, в частности, заместителя председателя Архивного комитета Санкт-Петербурга Крылова П.А. и специалиста отдела формирования, государственного учета и научно-справочного аппарата Архивного комитета Правительства Санкт-Петербурга Чирковской Д.А., существующей нормативной и методической базы недостаточно для проведения качественной экспертизы ценности и отбора электронных документов для архивного хранения в организациях.
Можно выделить и другие характеристики текущего положения дел затрудняющих положение дел, такие как отсутствие или очень ограниченный опыт проведения экспертизы ценности электронных документов, отсутствие систематизированных требований к ним, за небольшим исключением отсутствие типовых видов электронных документов и появление новых видов документов и их форматов, которые не принято рассматривать как документы, например, у многих организаций нет понимания, что базы данных тоже являются документами и их следует вносить в номенклатуру дел и проводить их экспертизу ценности.
Кроме этого, появляются новые задачи экспертизы ценности, такие как определение и отбор документов для замещающего сканирования, это касается как документов, нормативный срок хранения которых истек, так и тех, для которых нормативный срок не установлен.
НАУЧНЫЙ ВЕСТНИК КРЫМА, № 5 (34) 2021
Уточняя два базовых вопроса экспертизы ценности документов [6], сформулируем задачи следующим образом:
- категоризация документов (выделение документов подлежащих государственному хранению и учету, выделение среди них особоценных и уникальных документов; выделение документов, подлежащих архивному негосударственному хранению; выделение документов, подлежащих замещающему хранению и др.);
- отбор документов на уничтожение.
Соответственно, можно сделать вывод о том, что необходимо развивать теоретико-методологическую базу экспертизы ценности документов с учетом уровня проведения [7] и оцениваемых систем документации [8] [9], а также процедурно-технологические решения, позволяющие осуществлять и обеспечивать программно-технологическую поддержку.
Экспертиза ценности документов является одной из самых интеллектуально насыщенных видов деятельности, осуществляемых в процессе жизненного цикла документа. Стратегическое внимание к развитию искусственного интеллекта в настоящее время позволяет поставить вопрос о применимости технологий и систем искусственного интеллекта к задачам экспертизы ценности документов.
В Национальной стратегии развития искусственного интеллекта на период до 2030 года искусственный интеллект [10] определяется как -комплекс технологических решений, который во-первых позволяет имитировать когнитивные функции человека (включая самообучение и поиск решений без заранее заданного алгоритма), а во-вторых получать при выполнении конкретных задач результаты, сопоставимые, как минимум, с результатами интеллектуальной деятельности человека. Международная организации по стандартизации в ISO/IEC TR 24028:2020(en) Information technology — Artificial intelligence — Overview of trustworthiness in artificial
НАУЧНЫЙ ВЕСТНИК КРЫМА, № 5 (34) 2021 intelligence [11] в определении ИИ2 не указывает необходимость сопоставимости результатов работы ИИ с результатами интеллектуальной деятельности человека: искусственный интеллект - это способность разработанных систем приобретать, обрабатывать и применять знания и навыки3, при этом в примечании к данному определению указывается, что под знаниями понимаются факты, информация и навыки, полученные на основе опыта и обучения. Таким образом, по мнению автора, искусственному интеллекту отводится второстепенная роль, в силу которой такие системы не могут полностью заменить эксперта.
Отдельные решения уже существуют. Самыми распространенными направлениями применения технологий искусственного интеллекта (ИИ) в системах электронного документооборота в настоящее время является интеллектуальная обработка документа с целью заполнения регистрационно-учетной формы и распределения документов на рассмотрение в ходе предварительного рассмотрения. Такая обработка строится на алгоритмах машинного обучения [12] и других методах классификации текстовой информации [13] [14]. Следующим шагом может быть определение дела, к которому должен быть отнесен документ, определение связей документа с уже существующими в системе документами и задачами, определение возможных ограничений и прав доступа непосредственно на этапе ввода документа в систему, составление проектов номенклатур дел, на основе интеллектуальной обработки документов и дел прошлых лет, выявление дублирующих дел (дел, содержащих копии). И далее может быть поставлена задача применения технологий искусственного интеллекта для формирования проектов заключений по результатам экспертизы ценности документов.
Нормативно-правовое регулирование искусственного интеллекта
2 «AI capability of an engineered system (3.38) to acquire, process and apply knowledge and skills Note 1 to entry: Knowledge are facts, information (3.20) and skills acquired through experience or education»
3 Перевод автора
НАУЧНЫЙ ВЕСТНИК КРЫМА, № 5 (34) 2021
находится на стадии становления [15], в то время как инструментарий искусственного интеллекта развивается уже давно, проведена его систематизация и в январе 2021 года был принят ГОСТ Р 59277-2020 Системы искусственного интеллекта. Классификация систем искусственного интеллекта [16]. В соответствии с данной классификацией к системам ИИ, решающим задачи экспертизы ценности документов? следует отнести, системы, которые по функциям контура управления являются системами логического вывода, системами принятия (поддержки) решений и экспертно-аналитическими системами, а по специализации систем являются экспертными системами (системами управления знаниями).
Сама процедура выявления и определения критериев экспертизы ценности документов, веса этих критериев в общей оценке, а также степени соответствия этим критериям должна осуществляться на основе принципов и методов сетевой экспертизы [17].
Таким образом, в целях обеспечения применимости систем и технологий ИИ при проведении ЭЦД необходимо решить следующие задачи:
- выстроить многоуровневую систему ЭЦД со сквозной, не идентичной системой критериев;
- для каждого уровня сформулировать цель(и) отбора документов;
- документировать в единой базе данных (знаний) результаты ЭЦД с указанием критериев, на основании которых запись была отобрана для хранения, или особенных факторов с целью уточнения методологии (с учетом категории, уровня);
- определить взаимозависимость критериев ЭЦД и механизм их применения, а не только дать их определение.
- осуществить адаптацию методологии экспертизы ценности документов для целей ее реализации в системах ИИ.
- выстроить процедуру периодического уточнения критериев ЭЦД, при этом могут использоваться инструменты цифровых платформ для организации работы экспертов.
НАУЧНЫЙ ВЕСТНИК КРЫМА, № 5 (34) 2021
Актуализация методологии и процедур экспертизы ценности документов позволит применять прорывные технологии и в этой сфере управления документацией, частично исключая рутинные процедуры и повышая уровень глубокого анализа документа с целью определения его научно-исторической, политической, социально-экономической ценности.
Список литературы и источников:
1. Жукова М.П. Новые подходы в комплектовании государственных, муниципальных архивов (исследования последних лет) // Вестник ВНИИДАД. 2018. № 1. С. 17-22.
2. Лобанова А.М. Предпосылки и проблемы формирования унифицированной системы электронной управленческой документации (усэуд) // Научный вестник Крыма. 2016. №4 (4). URL: https://cyberlenmka.m/article/n/predposylki-i-proWemy-formirovamya-unifHsirovannoy-sistemy-elektronnoy-upravlencheskoy-dokumentatsii-useud (дата обращения: 11.04.2021).
3. Инфографика. Российский рынок внешнего документооборота -обмена электронными документами, // ЕСМ-Journal, 2018. URL: https://ecm-j ournal.ru/docs/Infografika-Rossijj skijj -rynok-vneshnego-dokumentooborota— obmena-ehlektronnymi-dokumentami.aspx
4. Приказ Минкультуры России от 31.03.2015 N 526 "Об утверждении правил организации хранения, комплектования, учета и использования документов Архивного фонда Российской Федерации и других архивных документов в органах государственной власти, органах местного самоуправления и организациях" (Зарегистрировано в Минюсте России 07.09.2015 N 38830)
5. Крылов П.А., Чирковская Д.А. Проблемы формирования и хранения архивов электронных документов в Российской Федерации // Управленческое консультирование. 2016. №5 (89). URL: https://cyberleninka.ru/article/n/problemy-formirovaniya-i-hraneniya-arhivov-
НАУЧНЫЙ ВЕСТНИК КРЫМА, № 5 (34) 2021 elektronnyh-dokumentov-v-rossiyskoy-federatsii (дата обращения: 11.04.2021).
6. Скреля К.Ю., Латышева Е.В. Экспертиза ценности как подход к изучению документа // Научный вестник Крыма. 2017. №6 (11). URL: https://cyberleninka.ru/article/n/ekspertiza-tsennosti-kak-podhod-k-izucheniyu-dokumenta (дата обращения: 23.04.2021).
7. Герчикова Н.А., Звавич В.И., Лобанова А.М. Пополнение базы данных «Государственный реестр уникальных документов Архивного Фонда Российской Федерации». Критерии уникальности// Документация в информационном обществе: задачи архивоведения и документоведения в условиях цифровой экономики. Доклады и сообщения XXV Международной научно-практической конференции 7-8 ноября 2018 г. / Федеральное архивное агентство, ВНИИДАД.- Москва: РИД РосНОУ, 2019.- С. 149-154.
8. Лобанова А.М. Проблемы методологии и практики уточнения критериев выявления уникальных документов Архивного Фонда Российской Федерации // Русскоязычная версия ATLANTI Том 27 (2017) №1-2, Триест -Марибор - Москва, 2018 - с. 182-188.
9. Черешня А.Г. Об уточнении оценочного аппарата экспертизы ценности научно-технической документации// «Отечественные архивы» № 3 2018 г. с.36-49. Лобанова А.М. К вопросу о методике экспертизы ценности научно-технических документов: на примере архива национального управления океанических и атмосферных исследований США// Вестник ВНИИДАД. 2021. № 1 С. 131-141.
10. Указ Президента РФ от 10.10.2019 N 490 "О развитии искусственного интеллекта в Российской Федерации" (вместе с "Национальной стратегией развития искусственного интеллекта на период до 2030 года")
11. ISO/IEC TR 24028:2020(en) Information technology — Artificial intelligence — Overview of trustworthiness in artificial intelligence https://www.iso.org/obp/ui/#iso:std:iso-iec:tr:24028:ed-1:v1:en
12. Мордвинов А. В. Методика автоматической категоризации текстов // Труды НГТУ им. Р. Е. Алексеева. 2010. №4. URL:
НАУЧНЫЙ ВЕСТНИК КРЫМА, № 5 (34) 2021 https://cyberleninka.ru/article/n/metodika-avtomaticheskoy-kategorizatsii-tekstov (дата обращения: 23.05.2021).
13. Kamruzzaman M.S. Text Classification using Artificial Intelligence // ResearchGate, September 2010 https://www.researchgate.net/publication/46587273_ Text_Classification_using_Artificial_Intelligence (дата обращения: 19.04.2021).
14. Умаров Т.С., Баженова И.Ю. Современные подходы к механизмам извлечения причинно-следственных связей из неструктурированных текстов на естественном языке // International Journal of Open Information Technologies. 2019. №7. URL: https://cyberleninka.ru/article/n/sovremennye-podhody-k-mehanizmam-izvlecheniya-prichinno-sledstvennyh-svyazey-iz-nestrukturirovannyh-tekstov-na-estestvennom-yazyke (дата обращения: 19.04.2021).
15. Бегишев Ильдар Рустамович, Латыпова Эльвира Юрьевна, Кирпичников Данила Владимирович Искусственный интеллект как правовая категория: доктринальный подход к разработке дефиниции // Актуальные проблемы экономики и права. 2020. №1. URL: https://cyberleninka.ru/article/n/iskusstvennyy-intellekt-kak-pravovaya-kategoriya-doktrinalnyy-podhod-k-razrabotke-definitsii (дата обращения: 03.04.2021).
16. ГОСТ Р 59277-2020 "Системы искусственного интеллекта. Классификация систем искусственного интеллекта" утвержден приказом Росстандарта от 23 декабря 2020 года N 1372-ст.
17. Лобанова А.М., Тюрин В.В. (2019) Цифровые платформы. Возможности для архивов. Ключевые элементы модели цифровой платформы поддержки использования архивных документов //Документация в информационном обществе: задачи архивоведения и документоведения в условиях цифровой экономики. Доклады и сообщения XXV Международной научно-практической конференции 7-8 ноября 2018 г. / Федеральное архивное агентство, ВНИИДАД.- Москва: РИД РосНОУ, 2019.- pp. 240-248.