Skorobogatov Sergey Yurievich, docent, [email protected], Russia, St. Petersburg, Military Academy of Communications named after S.M.Budyonny
УДК 303.093.7
DOI: 10.24412/2071-6168-2022-3-352-358
МОДЕЛЬ ПЕРЕДАЧИ ОБРАЗОВАТЕЛЬНОГО КОНТЕНТА ПО КАНАЛУ СВЯЗИ
«ПРЕПОДАВАТЕЛЬ-ОБУЧАЮЩИЙСЯ» С ИСПОЛЬЗОВАНИЕМ ТСО
М.В. Митрофанов, Т.Н. Атнагуллов, А.В. Шадымов, Г.Ш. Бибарсова
Состояние системы подготовки характеризуется количеством того или иного вида знаний, сообщенных преподавателем и усвоенных обучающимися. Повышение качества подготовки, зависимость усвоения образовательного контента от скорости поступления информации, влияние технических средств обучения на скорость усвоения образовательного контента составляет суть настоящей статьи.
Ключевые слова: учебный процесс, усвоение, технические средства обучения, образовательный контент.
Учебный процесс можно представить в виде многоконтурной системы управления. Одним из контуров этой системы является подсистема непосредственного обучения, которая представлена на рис. 1, где - суммарный образовательный контент, переданный преподавателем; W0 - образовательный контент, усвоенный обучающимся; Т1, Т2 - сигнал обратной связи в цепи «обучающийся-преподаватель». Преподаватель сообщает ту или иную учебную информацию Wn объекту обучения (обучающемуся), который усваивает только часть ее: W0 < Wn.
Рис. 1. Обобщенная система управления учебным процессом
Задача преподавателя - это обеспечение оптимальных условий обучения, то есть, в терминах исследования операций, преподавателю необходимо максимизировать (минимизировать) целую функцию [1], представленную в формуле (1):
W=X (X,Y), (1)
где X - вектор управляемых переменных; Y - вектор неуправляемых переменных.
Для учебного процесса в качестве управляемых переменных выступают: объем образовательного контента, переданного в одну условную единицу времени (УЕВ), качество образовательного контента, технические средства обучения (ТСО) и т.д.
В качестве неуправляемых параметров выступают: имеющийся объем базиса знаний обучающегося, а также дополнительная информация, которую обучающиеся приобрели в ходе самостоятельной подготовки, поиска ее в сети Интернет. Искаженное восприятие и неправильная (для совершения действий) переработка информации, а также полученная информация в условиях природных и деструктивных воздействий.
В качестве ограничений выступают: ресурс времени, программа курса, характеристики объекта обучения, некоторые параметры среды и т.п. Особенностью данной системы является прежде всего существенное запаздывание сигнала т обратной связи в цепи «обучающийся-преподаватель». Во время занятия преподаватель использует методическую подготовку, характеризующуюся объемом методического контента, несущего информацию о степени взаимосвязи излагаемой информации, ее относительной важности, условиях приема полученной информации. Предполагается, что методический контент состоит из словесной конструкции, активизирующей обучающихся и фиксацию самого образовательного контента. Тем самым преподаватель реализует обратную связь по косвенным признакам - вниманию аудитории, ее активности и ряду других. При этом, особенно при чтении лекции в больших аудиториях, возможность обратной связи, реализуемой практически без запаздывания (т = 0), зависит от методического опыта преподавателя.
Ввиду того, что задача ограничивается подсистемой непосредственного обучения, то в качестве основной управляемой переменной берется величина равная объему информации, передаваемая в одну условную единицу времени (УЕВ).
В рассматриваемой модели время ^ (УЕВ) выступает в качестве независимой переменной и может измеряться в часах, сутках или месяцах.
Состояние системы подготовки характеризуется количеством того или иного вида знаний, сообщенных преподавателем и усвоенных обучающимися; эти величины могут измеряться в некоторых условных единицах информации (УЕИ), интерпретируемых с целью сохранения общности выводов и получения универсальной модели обучения; сообщаемый преподавателем образовательный контент может быть представлен в виде множества логически независимых порций знаний, одинаково хорошо усваиваемых обучающимся.
В модели не рассматривается изучение конкретной дисциплины определенной группой обучающихся, а анализируется ситуация в самом общем виде. С целью сохранения общности выводов и получения универсальной модели обучения количество знаний измеряется в условных единицах информации (УЕИ). Длительность обучения измеряется в условных единицах времени (УЕВ).
У различных обучающихся коэффициенты усвоения а и забывания у сильно отличаются. Коэффициент усвоения характеризует отношение числа правильно принятых УЕИ к общему числу переданных УЕИ. В свою очередь, коэффициент забывания характеризует скорость потери усвоенных УЕИ в УЕВ. В разрабатываемой модели они подобраны так, чтобы результаты моделирования соответствовали некоторому гипотетическому обучающемуся, который на 70-90 % справляется с учебной программой.
На обучение влияет огромное количество различных факторов, поэтому модели системы подготовки принципиально не могут быть очень точными. П. П. Чабаненко анализируя аналогичную проблему функционирования человеко-машинных систем, отмечал, что «адекватна не та модель, которая дает меньшие погрешности расчета показателей, а та, которая лучше отображает их объективный характер» [2]. Критерием адекватности модели системы подготовки является степень соответствия характера отклика модели (то есть знаний обучающегося) на изменение распределения учебного материала, требований преподавателя, параметров обучающегося (то есть входных величин) характеру объективно существующих закономерностей учебного процесса.
Разрабатываемая модель не учитывает индивидуальные отклонения коэффициентов усвоения и забывания обучающихся от среднестатистических значений.
В качестве допущения принято условие, что если переданные УЕИ образовательного контента доставлены до обучающегося, то они им усвоены. Это допущение обусловлено тем, что отбор обучающихся на программу подготовки осуществлен правильно, обучающийся в состоянии освоить программу подготовки, его психофизиологическое состояние в норме.
Получающиеся графики и выводы следует рассматривать как результат исследования конкретной математической модели некоторой системы подготовки, состоящей из преподавателя и группы обучающихся, которая соответствует ситуации, которая ограниченна сформированным ниже набором исходных данных.
Исходные данные: ' - знания обучающегося; О - усилия обучающегося; -требования преподавателя (суммарный объем образовательного контента); Т - длительность обучения; Q - сложность учебного материала; J - отставание обучающегося; С - скорость увеличения знаний; а - коэффициент усвоения; у - коэффициент забывания; V - скорость передачи информации преподавателем; г - уровень сложности; ^ - работоспособность обучающегося.
Построение модели. Допустим, изучаемая тема включает в себя т условных единиц информации (УЕИ): определений, суждений или информационных блоков. Эти УЕИ связаны между собой, а преподаватель в каждый данный момент требует усвоения всей изученной информации, то есть его уровень требований равен объему Ц переданного им образовательного контента с учетом его сложности. При этом сложность /-го УЕИ Qi пропорциональна затратам времени и усилий, требующихся для усвоения данного УЕИ; причем у самого простого УЕИ Qi = 1, а у более сложных - Qi > 1. Так как весь образовательный контент в конечном счете передается в словесной форме, то сложность того или иного блока учебного материала можно оценить. Для расчета уровня требований Ц используется формула: Ц = Ql + Q2 + ... + Qi + ... + Qn , где Qi - сложность / -го понятия, п - количество понятий в блоке. Если все п УЕИ имеют сложность 1, то ЦП равно п. Если образовательный контент содержит 330 понятий (УЕИ), из которых 115 имеют сложность 1, 179 понятий - сложность 2, а остальные 36 понятий - сложность 3, то уровень требований преподавателя ЦП = 115 1+179-2 + 36 3 = 581 УЕИ. Скорость передачи информации V = ЦП / t (V = йЦ'1^) / ё) равна объему образовательного контента, переданного преподавателем в условную единицу времени (УЕВ), и зависит от уровня требований ЦП, то есть от числа п УЕИ и их сложности Qi (/ =1, 2, 3, ..., п).
Результат обучения сильно зависит от усвоения изучаемого образовательного контента. Обучающийся усваивает сообщаемую ему информацию лишь тогда, когда он может соотнести ее с собственной категориальной системой понятий. В его сознании происходит перекодирование поступающей речевой или текстовой информации, ее «укладывание» в собственную понятийную систему с последующим запоминанием. Чем сложнее утверждения преподавателя, тем быстрее растет уровень его требований ЦП (то есть скорость V = йЦ'1^) / й выше) и тем больше мыслительных действий должен совершить обучающийся, чтобы их понять. Если преподаватель излагает сложные вопросы, перескакивая через рассуждения, представляющие трудность для обучающегося, то обучающийся не сможет или не успеет связать сообщаемую ему новую информацию с собственной системой понятий, не усвоит до конца всех проводимых рассуждений.
Технические средства обучения обеспечивают такое укладывание образовательного контента (УЕИ), которое при определенной скорости передачи образовательного контента позволяет повысить усвоение переданного преподавателем объема УЕИ.
Если пренебречь забыванием, то скорость увеличения знаний обучающегося пропорциональна усилиям О({), затрачиваемым в единицу времени: / й = аО(0. Затрачиваемые обучающимся усилия О: 1) при небольших J(t) = Ц^ф - (ЦП незначительно превышает
Ц°) пропорциональны величине J ; 2) при больших J плавно уменьшаются до 0. Зависимость О = О^) можно аппроксимировать функцией, представленной выражением (2):
0,0127^ ^^^^ (2)
О (J) =
график которой представлен на рис. 2.
1 + ехр(( J -150)/50)
= С (J) • J,
1.8"
1.<
1.41.2-I Г 0.806 0.40.2"
100
200
300
400
500
Рис. 2. График зависимости
354
Из него видно, что существует оптимальная разность J(t) = - '(0, при которой скорость увеличения знаний максимальна. Величина С(/)=0,0127(1+ехр[0,02/ - 3])-1 может быть интерпретирована как пропускная способность канала связи между преподавателем и обучающимся. Она позволяет учесть, что при больших / обучающийся перестает понимать всю сообщаемую преподавателем информацию и, осознав это, уменьшает прилагаемые усилия. В этом случае с ростом скорости V сообщения информации увеличивается /, а это влияет на С. При этом С не зависит от V явным образом.
Во время обучения непрочные знания переходят в прочные (формируются умения и навыки), которые забываются медленнее. Рассмотрим трехкомпонентную модель, выражающуюся (во время обучения I = 1, а когда оно прекращается I = 0), уравнениями (3-6):
^)
1а1 /
А
1 + ехр(г (/ - ц))
- /фД° - уД°;
аж2° о )
А
= !ф1Ж1° - ¡ф'О - у'
где / = ' - ', г = 0,02, ц = навыков обучающегося. Они
забывания
71 = 2
Л-3
(3)
(4)
(5)
(6)
150; Ж1°, Ж2° и Жз° - количества непрочных знаний, умений и отличаются прочностью усвоения и имеют коэффициенты
усвоения
= 1ф'° - у3Щ°,
А
' = + Ж2° + 'з
о
10 , У2 = 2-10-4,У3 = 2-10-
Коэффициенты
а1 = 0,17, ф1 = 5 -10 , ф2 = 1,7 -10 характеризуют быстроту усвоения знаний обучающимся и
перехода непрочных знаний в прочные [3]. Результат обучения характеризуется суммарным уровнем приобретенных знаний .
Результаты моделирования. Пусть в промежутке от 0 до 300 УЕВ обучающийся должен усвоить определенный объем образовательного контента (например, каналы утечки информации, угрозы информационной безопасности и т.д.). Содержится цикл по времени, в котором задается уровень требований преподавателя и определяется количество знаний обучающегося Ж1° , Ж2° и Жз° на следующем временном шаге. Во время обучения скорость поступления информации от преподавателя V остается постоянной, причем в каждый момент преподаватель требует знания всего предыдущего материала. При этом уровень требований преподавателя растет по закону: = V • t . Результаты моделирования обучения при оптимальной (%пт = 10 УЕВ-1) и слишком большой скорости передачи информации (V > Vопт) представлены на рис. 3 и рис. 4.
Когда V < Vопт , обучающийся на занятии усваивает практически весь образовательный контент (рис. 3).
100
Л ¿У
Л/ 'А)
У
/ 7
300
Рис. 3. Обучение при различных скоростях V (V < кот)
Если V > Vопт, то сначала ^ < 180 УЕВ) обучающийся успевает следить за рассуждениями преподавателя и усваивает практически все УЕИ. Затем обучающийся «отрывается» от преподавателя, перестает понимать и усваивать его рассуждения (рис. 4).
Разрыв J между уровнем требований Ц1^) и знаниями обучающегося возрастает, прилагаемые обучающимся усилия О уменьшаются. После обучения ^ > 300 УЕВ) из-за забывания Ц°, Ц2° и Жз° уменьшаются. Аналогичные графики Ц°(0, + и Жз°(0, соответствующие ступенчатому увеличению изображены на рис. 5.
0" 400 и/ЕВ
Рис. 5. Изменение W2О(t) и W3О(t)
Зависимость количества усвоенных обучающимся знаний от скорости из-
ложения нового материала V. При проведении серии вычислительных экспериментов, изменяя V от 1 до 20 УЕВ-1 при длительности обучения 400 УЕВ. Буду считать, что 1 УЕВ составляет полминуты, тогда продолжительность обучения около 3,5 часов. Пусть в момент ^ = 400 УЕВ, соответствующий окончанию обучения, осуществляется контроль его знаний Ц°(0. В результате график зависимости знаний обучающегося Ц° в конце обучения (^ = 400 УЕВ) от скорости V поступления образовательного контента показан на рис. 6.
Из них видно следующее: 1) при V < 11 УЕВ-1 количество усвоенных знаний Ц° увеличивается прямо пропорционально V ; 2) при V > 11 УЕВ-1 количество усвоенных знаний Ц° резко падает; 3) существует оптимальная скорость подачи информации (около 11 УЕВ-1 ), при которой количество усвоенных знаний Ц° достигает максимума.
Полученные результаты согласуются со второй теоремой Шеннона: если скорость передачи не превышает пропускной способности канала связи с шумом, то всегда найдется способ кодирования, при котором сообщение будет передаваться с требуемой достоверностью (то есть обучающийся усвоит сообщаемую информацию). Можно сформулировать и обратное утверждение: если производительность источника превышает пропускную способность канала связи с шумом, то не существует никакого метода кодирования, позволяющего безошибочно
передать сообщение [4]. Под кодированием в данном случае следует понимать «укладывание» обучающимся сообщенной информации в собственную понятийную систему с последующим запоминанием.
W0 зооо 2000 1000 о
(N ^ Ю ОО 0\
i/o (N т
^ ЧО ОО О (N ^ '—'—'—(Ч (Ч (Ч
V, УЕВ-
Рис. 6. Зависимость количества усвоенных знаний W0 от скорости v поступления
образовательного контента
Роль шума играют случайные процессы, препятствующие усвоению. Рассмотренная модель обучения позволяет объяснить скачкообразный характер зависимости степени усвоения логически связанных между собой УЕИ от скорости изложения материала. При слишком большой скорости поступления новой информации обучающийся не успевает следить за ходом мысли и «отрывается» от преподавателя. В результате последующая информация усваивается существенно хуже, обучающийся не понимает изучаемую тему.
Одним из направлений повышения усвоения учебного материала обучающимися является применение технических средств обучения для подготовки специалистов.
Список литературы
1. Леонтьев Л.П., Гохман О.Г. Проблемы управления учебным процессом: математические модели. Рига, 1984. 239 с.
2. Чабаненко П.П. Исследование безопасности и эффективности функционирования систем человек-техника эргосетями. Севастополь, 2012. 160 с.
3. Майер Р.В. Компьютерная модель обучения с изменяющимся коэффициентом забывания // International Journal of Open Information Technologies. 2014. Vol. 2, № 1. Р. 12-16. [Электронный ресурс] URL: http://inioit.org/index.php/j1/article/view/59/51 (дата обращения: 17.01.2022).
4. Митрофанов М.В., Стародубцев Ю.И. Информационная модель образовательного процесса: проблемы и решения // Электросвязь. 2020. № 8. С. 8-13.
Митрофанов Михаил Валерьевич, канд. техн. наук, доцент, начальник кафедры, [email protected], Россия, Санкт-Петербург, Военная академия связи им. Маршала Советского Союза С.М. Буденного,
Атнагуллов Тимур Нагимович, адъюнкт, [email protected], Россия, Санкт-Петербург, Военная академия связи им. Маршала Советского Союза С.М. Буденного,
Шадымов Алексей Владимирович, канд. воен. наук, доцент, [email protected], Россия, Санкт-Петербург, АНО ВО «Университет при межпарламентской ассамблее ЕВРАЗЭС»,
Бибарсова Гульнара Шихмуратовна, канд. пед наук, доцент, bgsh2@,rambler. ru, Россия, Санкт-Петербург, Военная академия связи им. Маршала Советского Союза С.М. Буденного
MODEL OF TRANSMISSION OF EDUCATIONAL CONTENT VIA "TEACHER-STUDENT" COMMUNICATION CHANNEL USING TECHNICAL TEACHING TOOLS
M.V. Mitrofanov, T.N. Atnagullov, A.V. Shadymov, G.Sh. Bibarsova
357
The state of the training system is characterized by the amount of one or another type of knowledge communicated by the teacher and learned by the students. Improving the quality of training, the dependence of the assimilation of educational content on the speed of information receipt, the influence of technical teaching aids on the speed of assimilation of educational content is the essence of this article.
Key words: educational process, assimilation, technical means of teaching, educational content.
Mitrofanov Mikhail Valerievich, candidate of technical sciences, docent, head of department, [email protected], Russia, St.Petersburg, Military Academy of Communications named after Marshal of the Soviet Union S.M. Budyonny,
Atnagullov Timur Nagimovich, postgraduate, [email protected], Russia, St.Petersburg, Military Academy of Communications named after Marshal of the Soviet Union S.M. Budyonny,
Shadymov Alexey Vladimirovich, candidate of military sciences, docent, [email protected], Russia, Saint Petersburg, ANO VO "University at the Interparliamentary Assembly of EURASEC",
Bibarsova Gulnara Shikhmuratovna, candidate of pedagogical sciences, docent, [email protected], Russia, St. Petersburg, Military Academy of Communications named after Marshal of the Soviet Union S.M. Budyonny
УДК 004.891.2
DOI: 10.24412/2071-6168-2022-3-358-366
МЕТОДЫ АНАЛИЗА ЕСТЕСТВЕННОГО ЯЗЫКА В ЗАДАЧАХ ДЕТЕКТИРОВАНИЯ
ПОВЕДЕНЧЕСКИХ АНОМАЛИЙ
П.А. Савенков, А.Н. Ивутин
Рассматривается задача поиска аномального поведения пользователя по введенному им тексту на мобильном устройстве в выбранных временных периодах. Осуществляется сравнение применяемых методов и алгоритмов анализа данных в задаче поиска аномального поведения пользователя на различных пользовательских наборах данных взятых за различные временные промежутки. Установлено, что минимальная длина текста, предназначенная для анализа, составляет 7 и максимальная 100 символов. Получены сравнительные характеристики представленных методов. Доказано, что применение методов TF-IDF, Word2Vec, BERT, GloVe имеет большую результативность чем использование bag of words и tf-idf в задаче поиска аномального поведения пользователей. Предложен алгоритм, идентификации пользователя и отклонений в его поведении на основе комбинированного применения методов анализа естественного языка и метрик сходства в зависимости от типа и объема входных данных.
Ключевые слова: машинное обучение; поведенческая биометрия; аномальное поведение, обработка естественного языка, косинусное сходство.
Актуальным является развитие направления обнаружения ранних признаков аномального поведения пользователей на основе методов машинного обучения. В связи с возрастанием внутренних угроз в корпоративных информационных системах, в последние годы наблюдается устойчивый рост интереса к задачам поиска аномальной активности в деятельности пользователей [1]. В настоящее время сформировался отдельный, самостоятельный класс систем поведенческого анализа в основе которых лежат методы и алгоритмы машинного обучения. Компания Gartner именует данные системы как UBA (англ. User Behavior Analytics — анализ поведения пользователей) [2]. UBA-системы осуществляют анализ различных действий пользователя и информируют администратора системы в случае обнаружения отклонений в поведенческом профиле, используя при этом исторические данные о нормальной работе пользователя. Актуальной проблемой является идентификация пользователей и поиск отклонений в их поведении по наборам коротких текстовых данных.