https://doi.org/10.3402/gha.v3i0.5244.
6. Amegbor P. M., Addae A. Spatiotemporal analysis of the effect of global development indicators on child mortality // I. J. of Health Ge-ographics. 2023. V. 22. P. 9. https://doi.org/10.1186/s12942-023-00330-x.
7. Mazhitova G. Z., Pashkov S.V. Medical and geographical assessment of the socioeconomic comfort of the territory of the North Kazakhstan region // Proceedings of the Tula State University. Earth Sciences. 2018. Issue 1. pp. 307-316.
8. Ministry of Health of the Republic of Kazakhstan. Access mode: https://www.gov.kz/memleket/entities/dsm?lang=ru (reporting period: 03/15/2024).
9. Bureau of National Statistics of the Republic of Kazakhstan. Access mode: https://stat.gov.kz/ru / (circulation period: 03/15/2024).
10. Problems of estimating mortality rates from individual causes (Position Statement) / O.L. Barbarash [and others] // Complex problems of cardiovascular diseases. 2018. No.7(2). pp. 6-9.
11. Boitsov S.A., Samorodskaya I.V. High mortality from BSK in Russia: are approaches to coding causes of death adequate? // Kar-diologiya. 2015. No.55(1). pp. 47-51.
12. Puzachenko Yu.G. Mathematical methods in geographical and environmental studies. M.: Academy. 2004. 410 p.
13. Filandysheva L.B., Sapyan E.S. Statistical methods in geography. Tomsk: Publishing House of TSU, 2015. 164 p.
УДК 004.89:004.4
МЕТОДЫ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ТЕКСТОВЫХ
ДАННЫХ В ЗАДАЧЕ АНАЛИЗА ЭМОЦИОНАЛЬНОГО СОСТОЯНИЯ ПОЛЬЗОВАТЕЛЕЙ
П.А. Савенков, А.Г. Волошко, А.Н. Ивутин
Цифровизация и автоматизация процессов горнодобывающей промышленности привела к росту требований к сотрудникам, что в условиях острого дефицита кадров ставит задачу грамотного управления персоналом. Повысить эффективность работы с кадрами возможно путем анализа особенностей взаимодействия работника с компьютером и мобильными устройствами с целью обнаружения нетиповых паттернов взаимодействия и оценки его эмоционального состояния. Одним из важных подготовительных этапов такого анализа являются предобработка собранных данных о взаимодействии пользователя с устройством, результатом которой является набор сообщений, пригодных для дальнейшего анализа и классификации нейросетевыми методами. Методы предобработки представлены в данной статье.
Ключевые слова: нейронные сети, кадровая политика, горнодобывающие предприятия, анализ текста.
Введение
В настоящее время в горнодобывающей промышленности наблюдается переоснащение производства и реинжиниринг процессов, направленные на внедрение автоматизированных комплексов добычи и переработки
сырья. Внедряются технологии «Интеллектуальный карьер» и цифровиза-ция производства, которые предусматривают использование беспилотных самосвалов, погрузчиков, использование технологий интернета вещей (1оТ) и сенсорных сетей [1], а также единой системы управления всей техникой. Благодаря этому удается повысить эффективность производства [2, 3] Эти трансформации приводят к изменению условий труда работников и к увеличению доли профессий в горном деле, в которых рабочее место представляет собой пульт оператора или компьютер. Это в свою очередь приводит повышению требований к подготовке кадров в этой отрасли. Однако, как указал в своем интервью ректор Уральского государственного горного университета Алексей Владимирович Душин, дефицит кадров в отечественной горной отрасли составляет 60 тысяч вакансий, а к 2025 году вырастет еще на 20% [4].
Учитывая сложившуюся ситуацию, специалисты призывают совершенствовать кадровую политику и эффективность системы управления горных предприятий [5]. В работе [6] отдельно указывается на роль контроля в обеспечении успешной работы предприятий отрасли.
С точки зрения контроля в кадровой политике помимо традиционных возможно использование современных методов, основанные на искусственном интеллекте. Мониторинг деятельности персонала необходим по нескольким причинам:
- необходимость обеспечения процедуры дополнительного непрерывного непрямого автоматического контроля личности пользователя рабочих устройств вычислительной техники для защиты от неконтролируемой передачи конфиденциальных данных для обеспечения безопасности интеллектуальной собственности предприятия и его безопасности от внешних атак;
- необходимость мониторинга психо-эмоционального состояния сотрудников для обеспечения безопасности труда и эффективности использования трудовых ресурсов предприятия.
Решение этих задач на горных предприятиях особенно затруднено в связи со сложностью организации их структуры, в том числе и структуры управления. Так, головной офис компании, определяющий политику и стратегию может находится в тысячах километров от разрабатываемых месторождений. Само горное предприятие на месторождении тоже предполагает значительные занимаемые площади, на которых располагаются и добывающее производство, и лаборатории и отделы по техническому обслуживанию и ремонту, снабжению и логистике и др. И все это требует слаженной работы множества сотрудников.
Цифровизация производств предполагает, что координация, контроль и коммуникация в процессе деятельности происходит с использованием вычислительной техники, в том числе и мобильных устройств. Изме-
нение партернов поведения пользователя при взаимодействии с устройством и долгосрочное изменение психологического состояния работника могут сигнализировать для руководителя и сотрудников управления кадрами о проблемах, на которые следует обращать внимание. В этой связи предполагается, что использование специальных средств для автоматического мониторинга состояния пользователя может помочь в этой задаче. Рассмотрим подход к организации мониторинга.
Мониторинг эмоционального состояния и деятельности пользователя
Анализ деятельности пользователя вычислительного устройства подразумевает разделение его деятельности на типовую, которая не требует внимания со стороны руководителя, и нетиповую. Нетиповая деятельность может быть связана как с нарушением правил и должностных инструкция сотрудниками, так и заключаться в изменении паттернов взаимодействия с техникой или особенностей общения с коллегами или третьими лицами. Такое нетиповое поведение может быть вызвано, как объективными причинами, например, изменением порученных человеку задач, так и изменением эмоционального состояния сотрудника, например, в случае конфликта с коллегой. Поэтому прежде всего выявляются элементы нетипового поведения, которые затем подвергаются дополнительному анализу.
Методы анализа нетипового поведения пользователя отличаются при использовании персонального компьютера и мобильного устройства. Для персонального компьютера характерна возможность анализа поведенческой информации, полученной из различных информационных источников. Одним из подходов является анализ клавиатурного почерка. Данный метод основан анализе уникальных характеристик печати пользователя ПК. Данные собираются в режиме реального времени в процессе нажатия кнопок клавиатуры. В качестве исследуемых параметров используется скорость нажатий клавиш, ритм, то есть интервалы между набором определенных элементов текста, что является уникальным для каждого человека. Этот вид анализа уже давно успешно используется для идентификации личности пользователя и его нетипового поведения [7]. Помимо наличия возможности снятия временных интервалов клавиатурного почерка анализ может быть дополнен индивидуальными шаблонами ошибок, допускаемых пользователем в тексте при наборе.
Еще одним широко распространенным методом в области цифрового анализа поведения пользователя при его взаимодействии с персональным компьютером является использование промежуточного прокси сервера [8]. Он позволяет перехватывать и анализировать отправляемые и получаемые сообщения через определенные информационные каналы в полном объеме. Технический процесс перехвата данных включает в себя установку специального программного обеспечения на персональном компьютере, которое
перенаправляет сетевой трафик через промежуточный прокси-сервер. Программное обеспечение прокси-сервера сканирует, регистрирует и анализирует данные, проходящие через него, сохраняя информацию о пересылаемых пакетах данных, Ц^-адресах, заголовках запросов и других сетевых характеристиках. Эти данные могут анализироваться в автоматическом режиме с использованием методов машинного обучения и анализа естественного языка.
Помимо представленных методов достаточно часто используется прямая интеграция с базами данных таких источников как мессенджеры. Прямой доступ к базам данных обеспечивает непрерывное получение информации в неизменном виде для ее дальнейшего анализа.
В отличии от персонального компьютера, на мобильных устройствах отсутствует прямая возможность взаимодействия с цифровой клавиатурой в таком объеме ввиду ограничений мобильной операционной системы. Кроме того, отсутствует возможность получения времени нажатия, удержания и отпускания клавиш ввиду особенностей цифровой клавиатуры мобильных устройств, что не позволяет получать корректно временные характеристики как на компьютере.
Реализация локального прокси сервера на мобильном устройстве так же не является рациональной ввиду его нестабильной работы из-за системной оптимизации и прочих ограничений, связанных с особенностями мобильной операционной системы.
Наличие же прямого доступа к базам данных мессенджеров, браузеров и иных мобильных приложений вовсе недоступно, ввиду хранения файлов приложения в закрытых каталогах, куда доступ имеет только само приложение и/или операционная система.
Дополнительно следует отметить, что текстовые данные, обрабатываемые на мобильных устройствах, имеют определенные особенности, такие, как ограниченный объем текста, набираемого вручную в отдельных сообщениях/сеансах использования устройства, а системы контроля не имеют возможностей доступа к набираемым пользователями данным без глубоких вмешательств в операционную систему, что усложняет первичный сбор и дальнейшую агрегацию наборов текстов. Примером отличия процедур сбора и анализа данных пользователей может служить программный комплекс «Стахановец» для ПК и для мобильного устройства [9]. По данной причине сбор текстовых данных и анализ нетипового поведения пользователя мобильного устройства требуют определенного подхода, а именно использования сервиса специальных возможностей [10], позволяющего получать информацию о вводе с цифровой клавиатуры, а также данные о перемещении пользователя между окнами приложений в процессе взаимодействия с мобильным устройством.
Тем не менее можно выделить общие принципы мониторинга деятельности пользователя на основе анализа вводимых текстов.
На начальном этапе необходимо организовать сбор необходимой информации от пользователя на базе сервиса специальных возможностей [11]. Сбор данных необходим как для формирования профиля пользователя, так и для оценки соответствия текущей деятельности пользователя.
Далее собранные данные необходимо подвергнуть предварительной обработке, очистке от шумов и лишней информации, не имеющей значения к целям анализа.
На следующем шаге полученные наборы данных будут подвергнуты предварительной классификации с использованием нейросетевых моделей в соответствии с бинарной классификацией на позитивные и негативные данные, позволяющие оценить эмоциональный окрас сообщений.
Затем проводится еще один этап классификации, позволяющий уточнить сделанные выводы с использованием другой нейросети, определяющей следующие классы: токсичный, существенно токсичный, нецензурная лексика, угроза, оскорбление, личная ненависть/переход на личности для элементов, попавших на предыдущем этапе в класс негативных.
Одним из важнейших этапов является предобработка текстовых данных. От проведения этого этапа во многом зависит качество результатов следующей классификации, так как включение слишком большого количества текста может сделать выборку текста слишком зашумленной и исказить результат. В свою очередь отсутствие важных данных в выборке для анализа также сделает результат нерелевантным. Рассмотрим этот процесс подробнее. В связи с большей сложностью анализа и предобработки на мобильных устройствах, рассмотрим только этот метод и не будем затрагивать особенности работы с персональным компьютером.
Методы предобработки текстовых данных
Предобработку текстовых данных пользователей, собираемых с мобильных рабочих станций, можно разделить на две стадии:
• предобработка на мобильном устройстве для агрегации в текстовый набор;
• серверная предобработка.
Сбор текстовых данных пользователей на мобильных устройствах с ОС Android доступен при помощи использования системного сервиса «Accessibility Service» [11], предоставляющего доступ к элементам активного экрана пользовательских приложений во время их использования. Возможно настроить сервис как на определённые фильтры пользовательских действий, так и на интервал обновления и возврата данных. Собранные с использованием указанного сервиса данные представлены в виде массивов, для которых необходима дальнейшая обработка.
Сбор пользовательских данных часто производится по таймеру. Набираемый текст сохраняется в буфер до тех пор, пока временной интервал таймера не достигнет максимального значения, устанавливаемого
обычно в пределах 1-2 с. Интервал обнуляется при вводе следующего символа до тех пор, пока ввод не будет завершен, что позволяет достигнуть динамичности длины буфера и, следовательно, формирования законченных предложений, набираемых пользователем на мобильном устройстве. После истечения времени собранный буфер пользовательского ввода очищается, а сохраненные в нем данные попадают в набор для дальнейшего анализа. Данный метод относительно других обеспечивает меньшую потерю данных, а также более корректное разделение слов. Однако возможно дублирование набранного текста.
В связи с этим предлагается использовать комбинированный метод. Данный метод включает в себя сбор данных по таймеру с дополнительными сценариями обработки пользовательского ввода, такими как формирование завершенного сообщения и его выгрузку при нажатии на кнопку отправить (при работе в мессенджерах и социальных сетях), а также учет удаляемых пользователем символов. Применение данного подхода будет способствовать более корректному сбору вводимого пользователем текста. Применение комбинированного метода позволяет снизить вероятность некорректного считывания пользовательского ввода и представить собираемые сообщения в первичном виде.
Для работы с методами и алгоритмами машинного обучения, а именно анализа естественного языка, требуется дополнительная очистка наборов пользовательских текстов, называемая препроцессингом, выполняемая на сервере.
Такая предварительная обработка пользовательских текстов включает в себя следующие этапы:
• удаление стоп слов;
• приведение слов к единому регистру;
• токенизация.
Одним из важнейших этапов предобработки является удаление стоп слов. К стоп-словам относятся незначимые для оценки элементы текста: союзы, предлоги, знаки препинания, специальные символы, смайлы, цифры, ошибочно набранные слова, правильное написание которых часто встречается в тексте.
Поскольку текст представляет собой набор символов, а верхний и нижний регистр представляют разные символы, то для идентификации одинаковых слов, но написанных в различном регистре, необходимо выполнить дополнительную предобработки и привести все слова к нижнему регистру.
Токенизация представляет собой процесс разбиения текстов на отдельные токены. Токенами могут быть как символы, так и слова, либо группы слов (биграммы, триграммы и т.д.). В случае токенизации коротких наборов пользовательских текстов выполняется разбиение на слова для дальнейшего формирования частот использования определенных токенов
пользователями, использующими мобильные устройства, а также для классификации эмоционального состояния на их основе.
Принцип предобработки может быть представлен в математическом
виде.
Пусть задан алфавит 2 = {a, b, c,..., а, б, в,..., A, B, C,..., а, б, в+, -,...} в виде конечного множества допустимых символов. Тогда обозначим за 2allowed = {a,b,c,...,а,б,в,...} допустимый набор символов нижнего регистра
и пробел как разделитель, а 2- = {<те2: toLower(а)\ 2allowed} фильтруемый набор символов. Данные подмножества определяют первый этап предобработки, заключающийся в преобразовании изначального массива данных, рассматриваемых как набор 2 в набор 2allowed допустимых символов нижнего регистра:
^allowed ^ ^
Таким образом, предварительный этап подготовки текста позволяет сократить объем анализируемой информации без потери общей смысловой окраски. Для простоты далее будем считать, что любой алфавит, полученный в результате предварительных преобразований является алфавитом 2.
Токенизация представляет собой двуступенчатую обработку текста, когда первоначальная последовательность слов фильтруется на «лишние», типовые и зашумляющие слова из заданного набора, после чего токенизи-руются.
Определим строки, получаемые из алфавита 2 используя замыкание (звезду) Клини [12, 13]:
Для алфавита 2, заданного конечным множеством допустимых символов строки символов могут быть определены как:
S0 = {s}, S* = Si-1 S = {cs | c e Si-1 л s e 2}, i e N , (2)
или в общем случае
ГО
s (3)
/=0
где £ = 0 - пустая строка символов, с - строка символов, полученная на прошлой итерации, б - символ из множества допустимых символов.
Определим аналогичным образом множество Э, представляющее множество слов над алфавитом 2:
*
В = {х,у, 1,...} с2 ;
В0 = {V} В1 = Вг~1В = ^| W еВг~1 л w е В},1 е N ; (4)
* 00
в = и В1 ,
7=0
где W - строка слов над словарем Б, w - слово из словаря Б, V = 0 - пустая строка слов.
Следует отметить, что в случае, если предусмотрена операция фильтрации «лишних» слов, эта операция выполняется над исходным словарем Б, где итоговый набор формируется простой разностью множеств:
В' = В \ В", (5)
где В' - сокращенный словарь, В~ - словарь удаляемых из дальнейшего рассмотрения незначимых слов (предлоги, союзы и другие, в зависимости от особенности деятельности и необходимых задач по дальнейшему анализу).
Генерация строки символов из строки слов описывается как отображение О вида
, где в(V) = е, в(и1) = и, в(Ши) = в(Ш)в(и). (6)
Операция токенизации строки символов Т есть отображение
*
* в *
Тв : £ ^ 2 . Если Б строка символов такая, что 8 , имеем Тв (£) -
множество строк слов словаря, отображаемых операцией генерации строк символов О в строку символов Б:
*
Тв(£) = {Ш| в(Ш) = еВ }. (7)
Пример проведенных преобразований для предварительной обработки данных приведен на рисунке.
Исходный Текст ш О ->0' Текст без Т0:Г —> 2°* Набор токеиов из текста
текст символов стоп слов
Схема предобработки текстовых данных
Например, исходным текстом является следующий: «Уважаемые коллеги. Нам с вами необходимо выработать конкретные шаги и провести соответствующие мероприятия, направленные на повышение уровня безопасности нашего предприятия, а также определить ответственных за их осуществление. Телефон для связи 8-888-88-88. Первичное собрание планируется провести в кабинете 950 в 11:30 завтра.» После ряда этапов предобработки мы получаем текст следующего вида: «уважаемые коллеги необходимо выработать конкретные шаги провести соответствующие мероприятия, направленные повышение уровня безопасности нашего предприятия определить ответственных осуществление телефон связи первичное собрание планируется провести кабинете завтра». Все часто встречающиеся предлоги, специальные символы, а также цифры были удалены из предложения. Так же заглавные буквы были заменены на строчные (регистр переведен в нижний). Токенами будут являться отдельные неповторяющиеся слова:
"уважаемые", "коллеги", "необходимо", "выработать", "конкретные", "шаги", "провести", "соответствующие", "мероприятия", "направленные", "повышение", "уровня", "безопасности", "нашего", "предприятия", "определить", "ответственных", "осуществление", "телефон", "связи", "первичное", "собрание", "планируется", "кабинете", "завтра". Как видно из примера, в токенах слово "провести" встречается только один раз, а в исходном предложении встречалось несколько. В случае, если бы это слово было представлено в разной форме, то было бы получено несколько токенов, по одному на каждый его вариант.
Заключение
В результате проведения исследования рассмотрены методы мониторинга эмоционального состояния и деятельности пользователя на персональных компьютерах и мобильных устройствах.
Выявлено, что стандартные методы сбора и предварительной обработки текстовых данных для персональных компьютеров отличаются от методов, используемых для извлечения и очистки данных, набираемых на мобильных устройствах так как при работе с мобильными устройствами имеются сложности взаимодействия с цифровой клавиатурой и ограничения мобильной операционной системы, что не позволяет применять большинство стандартных методов. По данной причине предложно использование сервиса специальных возможностей как основного источника информационных потоков и дальнейшая обработка текстов с использованием таймера и дополнительных фильтров пользовательских действий, а также приведение к нижнему регистру, удаление стоп-слов и токенизация.
После проведения предварительной обработки, включающей описанные ранее этапы, на выходе формируется набор подготовленных текстов пригодных для дальнейшего анализа эмоционального окраса, а именно бинарной, многоклассовой и многозначной классификации для анализа нетипового поведения.
Представленные подходы к сбору и предварительной обработке данных позволят эффективно мониторить психо-эмоциональное состояние и деятельность пользователей вычислительных устройств, способствуя более точному анализу и выявлению паттернов поведения сотрудников.
Дальнейшее развитие исследований в данной области позволит углубить понимание процессов контроля и управления персоналом на горных предприятиях, а также разработать более точные и адаптивные методы мониторинга. Это, в свою очередь, приведет к улучшению условий труда работников и повышению их мотивации и лояльности к предприятию, а также, опосредованно к повышению безопасности производственных процессов. В итоге это позволяет рассчитывать на повышение эффективность деятельности предприятий горнодобывающей отрасли.
Исследование выполнено за счет гранта Российского научного фонда № 24-21-20022, https://rscf.ru/project/24-21-20022/ и комитета Тульской области по науке и инноватике.
Список литературы
1. Ковалев Р.Д., Зубов П.А., Иордан В.И. Инновационные технологии в горнодобывающей промышленности // Научный аспект № 6. Самара: Изд-во ООО «Аспект», 2023. Т20. С. 2605 - 2610.
2. Аброськин А.С. Проблема внедрения технологии «Интеллектуальный карьер» на горнодобывающих предприятиях РФ. iPolytech Journal, 2014. № 10 (93). С. 121-123.
3. Клебанов А. Ф. Автоматизация и роботизация открытых горных работ: опыт цифровой трансформации // Горная промышленность. 2020. №.1. С. 8-11.
4. Душин А.В. Горная отрасль в условиях дефицита кадров и цифро-визации [Электронный ресурс] URL: https://rectorspeaking.ru/gornaya-otrasl-v-usloviyah-deficita-kadrov-i-cifrovizacii (дата обращения 20.05.2024).
5. Семенцова Е. Д. Актуальные задачи кадровой политики горнодобывающих предприятий // Горная промышленность. 2017. №. 2 (132). С.100-101.
6. Баловцев С.В., Воробьева О.В. Совершенствование системы производственного контроля-залог успеха горнодобывающего предприятия //Горный информационно-аналитический бюллетень (научно-технический журнал). 2017. №. 2. С. 276-283.
7. Никуличева Е. О. Анализ клавиатурного почерка как метод идентификации личности // Актуальные вопросы судебной психологической экспертизы и комплексной экспертизы с участием психолога. Перспективы научного и прикладного исследования почерка. 2019. С. 56-60.
8. Юрченко А. Н., Будевич К. В., Нестерович Н. С. Анализ инструментов для отслеживания сетевого трафика в мобильном приложении на IOS // Актуальные научные исследования в современном мире. 2019. №124. С. 107-110.
9. Мобильный контроль // Программный комплекс "Стахановец" [Электронный ресурс] URL: https://stakhanovets.uz/mobilnyj-kontrol/ (дата обращения: 22.04.2024).
10. Способ блокировки доступа к данным на мобильных устройствах с использованием API для пользователей с ограниченными возможностями: пат. № 2618946 C1 РФ. МПК G06F 21/55, G06F 21/56, G06F 17/30. : № 2015154384; заявл. 18.12.2015: опубл. 11.05.2017.
11. Accessileaks: Investigating privacy leaks exposed by the android accessibility service / M. Naseri [et al.] // Proceedings on Privacy Enhancing Technologies, 2019/ Т. 2019. №. 2. P. 291-305.
12. Guo J. Critical tokenization and its properties // Computational Linguistics, 1997. Т. 23. №. 4. P. 569-596.
13. Aho A. V., Ullman J. D. The theory of parsing, translation, and compiling. Englewood Cliffs, NJ: Prentice-Hall, 1972. Т. 1. P. 368-399.
Савенков Павел Анатольевич, канд. техн. наук, доц., [email protected], Россия, Тула, Тульский государственный университет,
Волошко Анна Геннадьевна, канд. техн. наук, доц., [email protected], Россия, Тула, Тульский государственный университет,
Ивутин Алексей Николаевич, д-р техн. наук, проф., зав. кафедрой, [email protected], Россия, Тула, Тульский государственный университет
METHODS OF PRE-PROCESSING TEXT DATA IN THE TASK OF ANALYZING THE EMOTIONAL STATE OF USERS
P. A. Savenkov, A.G. Voloshko, A.N. Ivutin
Digitalization and automation of mining industry processes has led to increased demands on employees, which, in conditions of an acute personnel shortage, poses the challenge of competent personnel management. It is possible to increase the efficiency of work with personnel by analyzing the characteristics of an employee's interaction with a computer and mobile devices in order to detect atypical patterns of interaction and assess his psycho-emotional state. One of the important preparatory stages of such an analysis is the preprocessing of the collected data on the user's interaction with the device, the result of which is a set of messages suitable for further analysis and classification using neural network methods. Preprocessing methods are presented in this article.
Key words: neural networks, personnel policy, mining enterprises, text analysis.
Savenkov Pavel Anatolyevich, candidate of technical sciences, associate professor, [email protected], Russia, Tula, Tula State University,
Voloshko Anna Gennadievna, candidate of technical sciences, associate professor, [email protected], Russia, Tula, Tula State University,
Ivutin Alexey Nikolaevich, doctor of technical sciences, professor, head of the department, [email protected], Tula, Russia, Tula State University
Reference
1. Kovalev R.D., Zubov P.A., Jordan V.I. Innovative technologies in the mining industry // Scientific aspect No. 6. Samara: Publishing house of Aspect LLC, 2023. T20. pp. 2605 - 2610.
2. Abroskin A.S. The problem of introducing the technology "Intellectual quarry" at mining enterprises of the Russian Federation. iPolytech Journal, 2014. No. 10 (93). pp. 121123.
3. Klebanov A. F. Automation and robotization of open-pit mining: experience of digital transformation // Mining industry. 2020. No.1. pp. 8-11.
4. Dushin A.V. Mining industry in conditions of shortage of personnel and digitaliza-tion [Electronic resource] URL: https://rectorspeaking.ru/gornaya-otrasl-v-usloviyah-deficita-kadrov-i-cifrovizacii (accessed 05/20/2024).
5. Sementsova E. D. Actual tasks of personnel policy of mining enterprises // Mining industry. 2017. №. 2 (132). Pp.100-101.
6. Balovtsev S.V., Vorobyova O.V. Improvement of the production control system is the key to the success of the mining enterprise //Mining information and analytical bulletin (scientific and technical journal). 2017. No. 2. pp. 276-283.
7. Nikulicheva E. O. Analysis of keyboard handwriting as a method of identification of personality // Topical issues of forensic psychological examination and complex examination with the participation of a psychologist. The prospects of scientific and applied handwriting research. 2019. pp. 56-60.
8. Erchenko A. N., Budevich K. V., Nesterovich N. S. Analysis of software for tracking network traffic in an IOS mobile application // Computer technologies. scientific research in the modern world. 2019. No.12-4. pp. 107-110.
9. Mobile phone // stanganovets software package [Electronic resource] URL: https://stakhanovets.uz/mobilnyj-kontrol / (date of access: 04/22/2024).
10. Method of blocking access to data on mobile devices using the API for users with disabilities: pat. No. 2618946 RF C1. IPC G06F 21/55, G06F 21/56, G06F 17/30. : No. 2015154384; announced on 12/18/2015: published on 05/11/2017.
11. Accessileaks: Investigation of leaks of confidential information identified by the Android Accessibility Service / M. Naseri [et al.] // Materials on privacy enhancement technologies, 2019/ T. 2019. No. 2. pp. 291-305.
12. Go J. Critical tokenization and its properties // Computational Linguistics, 1997. Vol. 23. No. 4. pp. 569-596.
13. Aho A.V., Ulman J. D. Theory of syntactic analysis, translation and compilation. Englewood Cliffs, New Jersey: Prentice Hall, 1972. Vol. 1. pp. 368-399.