Научная статья на тему 'Математическое моделирование процесса обучения и самообучения на основе мультиэвристического подхода'

Математическое моделирование процесса обучения и самообучения на основе мультиэвристического подхода Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
165
78
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МУЛЬТИЭВРИСТИЧЕСКИЙ ПОДХОД / МОДЕЛИРОВАНИЕ ПРОЦЕССА ОБУЧЕНИЯ / МОДЕЛЬ МОЗГА / ДЕТЕРМИНИРОВАННЫЕ ТРАЕКТОРИИ / КОНЕЧНЫЙ АВТОМАТ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Пивнева Светлана Валентиновна, Купцов Никита Андреевич

В статье рассматривается моделирование процесса обучения человека на основе мультиэвристического подхода. Модель описывает взаимодействие центральной нервной системы мозга с окружающей средой. В данной модели механизмы изменения проводимости связей и их параметры обеспечивают быстрое обучение только в случае хорошо детерминированных событий.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Пивнева Светлана Валентиновна, Купцов Никита Андреевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Математическое моделирование процесса обучения и самообучения на основе мультиэвристического подхода»

Пивнева С.В.1, Купцов Н.А.2

1 Тольяттинский государственный университет, г. Тольятти, к.п.н., доцент кафедры высшей математики и математического моделирования, tlt.swetlana@rambler. ru

2 МБУ СОШ №20, г. Тольятти, ученик 11 класса

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ПРОЦЕССА ОБУЧЕНИЯ И САМООБУЧЕНИЯ НА ОСНОВЕ МУЛЬТИЭВРИСТИЧЕСКОГО ПОДХОДА

КЛЮЧЕВЫЕ СЛОВА

Мультиэвристический подход, моделирование процесса обучения, модель мозга, детерминированные траектории, конечный автомат.

АННОТАЦИЯ

В статье рассматривается моделирование процесса обучения человека на основе мультиэвристического подхода. Модель описывает взаимодействие центральной нервной системы мозга с окружающей средой. В данной модели механизмы изменения проводимости связей и их параметры обеспечивают быстрое обучение только в случае хорошо детерминированных событий.

Моделируя процесс обучения целесообразно рассматривать развитие человека как детерминированную динамическую систему в вероятностной среде с соответствующими параметрами. При описании работы мозга мы опираемся на исследования профессора, доктора биологических наук Евгения Алексеевича Умрюхина. Модель описывает взаимодействие центральной нервной системы мозга с окружающей средой [14].

Обобщая его работы и работы физиологов П.К.Анохина и К.В. Судакова, опишем последовательность информационных процессов в мозге, которая с точки зрения психобиологического подхода является основой построения модели его деятельности [1, 13, 14]. В процессе афферентного синтеза4 доминирующее мотивационное возбуждение с учетом поступающей извне обстановочной и пусковой афферентации5, проигрывает в структурах мозга возможные варианты удовлетворения существующей потребности.

Модель описывает взаимодействие центральной нервной системы мозга с окружающей средой. Устройство мозга, а, следовательно, и модели обеспечивает выживание организма в среде и выполнение генетически заложенной программы продолжения вида.

Принимается решение о выборе будущей программы действий и результатов действия — параметров будущих результатов, необходимых для удовлетворения мотивации. Осуществляемое поведение в случае рассогласования параметров промежуточных или конечного результата с намеченными параметрами результатов корректируется. Коррекция обеспечивает получение намеченных результатов и удовлетворение существующей потребности. Обратная связь от совпадений или рассогласований служит основой формирования памяти, т.е. обучения.

Мозг взаимодействует со средой, осуществляя генетическую программу организма. Отметим, что предлагаемая схема представляет функциональную систему в самом общем виде. Среда составляет ее часть и определяется взаимодействием между мозгом и средой [15]. Граница между мозгом и средой является условной и зависит от конкретной функциональной системы. В модели, в аспекте ее применения для математического моделирования обучения, будем считать средой не только внешнюю среду организма, но и его внутреннюю среду. Таким образом, все, что мозг воспринимает и то, чем мозг управляет, включая разные органы организма и органы движения можно считать средой [14, 15].

Взаимодействие мозга и среды рассматривается в виде траекторий поведения, представляющих собой последовательность сигналов X и действий У При этом, если при сигнале Ха, действие У вызывает переход к сигналу Хв, то такой переход Умрюхин Е.А. называет ситуацией

4 Афферентный синтез (от лат. afferens (afferentis) — приносящий) — в теории функциональной системы (П. К. Анохин) синтез материала, запечатленного в памяти, мотивации, информации о среде и пускового стимула с целью принятия решения [12].

5 Афферентация (в психофизиологии) (от лат. affero - приношу, доставляю) - термин, обозначающий передачу нервного возбуждения от периферических чувствительных нейронов к центральным [12].

Ха^У^Хв. Результаты Хв при разных действиях могут быть разными, в том числе совпадать с исходным сигналом X . В общем случае результат Хв зависит от исходного сигнала Ха и от совершаемого действия. Одни и те же ситуации в среде могут повторяться. Если каждый раз одно и то же действие У при одном и том же исходном сигнале Ха дает один и тот же результат Хв, то такую ситуацию называют детерминированной [15].

Если ситуация не детерминирована, но один и тот же переход от сигнала Ха к сигналу Хв при определенном действии совершается очень часто, почти всегда (хотя и с редкими исключениями), то такую ситуацию называют высоко воспроизводимой, а сигналы Ха и Хв воспроизводимыми сигналами [15].

Если при многократном появлении сигнала Ха и совершении действия У сигнал Хв появляется лишь в части случаев, а в другой значительной части этих случаев получаются другие сигналы, то такая ситуация может быть вероятностной. Для того, чтобы ситуация могла считаться вероятностной, необходимо, чтобы в разных реализациях среды воспроизводилась, т.е. была практически одинаковой, частота переходов между сигналами.

Три описанные ситуации — детерминированная, высоко воспроизводимая и вероятностная (как обобщение двух предыдущих) не исчерпывают различных возможных вариантов среды. Наиболее общим случаем является ситуация многовариативности, т.е. когда нельзя говорить о воспроизводимости даже частоты определенных переходов. В этом случае траектории сигналов в среде могут быть непредсказуемыми. Эта ситуация близка к хаосу [15]. Многовариативная ситуация неизбежно возникает даже для строго детерминированной среды, если информация о ней, передаваемая сигналами X, является неполной, и выбор действий ограничен. Фактически, реальная среда нашего существования всегда была и останется многовариативной [2, 3, 4]. Но при этом в ней иногда реализуются ситуации вероятностные, воспроизводимые и даже детерминированные.

Неоднозначность траекторий, т.е. переходов между сигналами X при совершении действий Y, является следствием неполноты получаемой мозгом в сигналах X информации, даже если за этими сигналами скрывается строго детерминированный мир. Реальный мир и взаимодействующий с ним мозг устроены так, что при соответствующем выборе сигналов X и действий Y становится возможным выделение и запоминание повторяющихся траекторий поведения. П.К. Анохин определил это свойство окружающего мира как наиважнейшее для формирования в мозге способности предвидения важных для выживания организма будущих событий [15].

При соответствующем выборе характеристик воспринимаемых сигналов и действий среда становится вероятностной. Это значит, что определенные траектории воспроизводятся, повторяются с определенной частотой, которая может в определенных случаях приближаться к единице. При этом траектории становятся высоко воспроизводимыми или даже детерминированные [14]. Оптимальное обучение в определенной среде и должно обеспечить выбор высоко достоверных, практически детерминированных траекторий.

Для математического моделирования обучения приведем обоснование применения предлагаемого мультиэвристического подхода [6, 10, 11].

Определим модель обучения как конечный автомат A с выходным языком как кортеж6

A = (Q, X, Y, 5, п, I, F),

где

• Q - конечное множество состояний; в нашей модели они выражают принятие решения в процессе обучения;

• X - входной алфавит {Н, С} (сигналы);

• Y- выходной алфавит {Н, С} (действия);

• 5 - функция переходов состояний (transition function) или траектории поведения под действием символов входного алфавита X, т. е. 5 :QxX^ ^Q ;

• п - функция выходов под действием символов входного алфавита X, т. е. п : QxX^ Y;

• I - множество начальных состояний;

• F - множество заключительных состояний. Рассмотрим две возможные ситуации:

1) правильно принятое решение;

2) неправильно принятое решение.

6 Понятие согласуется с терминологией, введенной в [6].

С помощью конечного автомата моделируется т. н. процесс принятия решений. Человек принимает решения по потоку информации в каждый момент времени, оценивая ее. Он может правильно оценивать ситуацию, состояние (С), а может и неправильно - состояние (А) (рис. 1).

С конечным автоматом А естественно связывается конечная марковская цепь с

вероятностями переходов pi,j из состояния 1 в состояние 7 (рис. 2).

Для вероятностей перехода pi,j выполняются естественные соотношения pi,j>0 и

^ р{= 1, т. е. если мы находимся в состоянии I, то в какое-нибудь состояние мы перейти

]

должны [5]. Скрытые марковские модели предполагают, что мы не знаем, сколько состояний и какие связи между ними, т. е. структура модели неизвестна, мы можем выдвигать гипотезы и определять параметры модели.

с/с с/н

н/с

Рис. 1. Пример автомата А, моделирующего обучение 0,1

0,8

Рис. 2. Пример автомата А с вероятностями переходов

Рассмотрим теперь оптимальное обучение, т. е. детерминированные траектории поведения. Результат преобразования автомата А1 представлен на рис. 3 в виде графа состояний автомата А2.

Алгоритм сворачивания ребер графа состояний эквивалентен выделению системы образующих подгруппы в конечно порожденной свободной группе и может использоваться в качестве вспомогательного, эвристического алгоритма для поиска недетерминированного состояния, эквивалентного заданному состоянию обучения [5].

Итак, соотнесем представленный математический аппарат с моделью, воспроизводящей структуру и механизм работы мозга.

Рассмотрим механизм формирования и изменения проводимостей связей при обучении модели [7, 8, 9]. В необученной модели связи между элементами блока (мозга) имеют малые проводимости, а также множество траекторий а, Ь. На рис. 4 определим:

• X - входные сигналы;

• Y - выходные действия;

• 1 - мотивационный элемент;

• L - условно выделенный слой мозга;

• 2, 3, 4, 5, 6, 7 - элементы структуры мозга;

• а, Ь - траектории.

Л1 А2

Рис. 3. Графы состояний исходного недетерминированного автомата A1 и свернутого детерминированного A2

При этом учитывается, что различие траекторий а и Ь относится к разным сигналам, имеющим разный уровень возбуждения соответствующий значимости информации. Возникающая в организме потребность выражается в возбуждении, распространяющемся из элемента 1 по связям или траекториям а и Ь в слой мозга. На вход поступают сигналы X, соответствующие входной афферентации.

Условно выделенные элементы мозга одного уровня соединены связями а, а элементы разного уровня связями Ь. Принятый в модели механизм изменения связей а и Ь при обучении одинаков для разных уровней и отличается только временными параметрами. Память формируется с помощью обратной связи от совпадения или рассогласования в акцепторе результатов действия намечавшихся результатов с получаемыми результатами.

Пусть в мозг поступают входные данные X, тогда получение конечного результата Y, закодированного в мотивационном элементе 1, служит сигналом положительного подкрепления для элементов мозга. Допустим, положительной подкрепление осуществляется через возбуждение элемента 4, выполняющего функцию положительной эмоции. Возбуждение из элемента 4 распространяется в слой мозга, а траектория а остается как «след» в памяти. На рис. 4 представлена цепочка элементов «слоя» мозга а также траектории для

запоминания в памяти, которая составляет акцептор результатов действия, намеченный для получения результата У При успешном осуществлении действия, каждый элемент данной последовательности мозга возбуждается, элементы выделенной цепочки сохраняют «след» этого возбуждения и, следовательно, вероятность наступления подобного действия в будущем возрастает

В случае рассогласования в акцепторе результата действия, т.е. несовпадения получаемого результата с намеченным результатом, переходим в модели к элементу 2 или 7, формирующему отрицательное подкрепление и отрицательную эмоцию. При этом существенно уменьшаются проводимости связей: и

Рис. 4. Представление необученной модели мозга, как графа состояний исходного недетерминированного

автомата

X У

ь

Рис. 5. Представление обученной модели мозга, как графа состояний свернутого детерминированного

автомата

С элементами 4, 2, 7 связано представление в модели положительных и отрицательных эмоций. В слое мозга каждого блока, проходя по цепочкам элементов памяти, мотивационное возбуждение «проигрывает» возможные варианты будущих траекторий поведения.

На рис. 5, в качестве свернутого детерминированного, выступает «обученный» мозг, с

установившимися детерминированными траекториями.

Поясним представленную модель. В этой модели связи или траектории а и Ь, объединяющие механизм доступа к информации и ее представление в виде сложных перцептивных элементов, реализуют принцип сочетания смысла информации и ее адреса. Это обеспечивает модели быстрое формирование будущей траектории поведения с учетом мотивации, входной афферентации и памяти без излишнего просмотра и перебора неадекватных вариантов такой траектории. В данной модели механизмы изменения проводимости связей и их параметры обеспечивают быстрое обучение только в случае хорошо детерминированных событий.

Применяемая эвристика отвечает на следующий вопрос: насколько чаще (реже) нужно обрабатывать недетерминированные вершины по сравнению с детерминированными? Ответ на вопрос мог быть найден с помощью генетических алгоритмов, но существует простое решение, основанное на рассмотрении нескольких возможных вариантов. На основе практического программирования делаем вывод, что для вершин обоих видов необходим примерно одинаковый объём работы [10, 11]. То есть алгоритмом, близким к оптимальному, является обработка одной детерминированной вершины после обработки одной недетерминированной и т.д.

Хочется отметить, что, предлагая такой вариант математического моделирования процесса обучения, авторы не претендуют на воспроизведение уникальности человеческой природы, его мозга, уникального сознания, поведения, настроения, чувств и т.д. Модель основана на принципе повторяемости, воспроизводимости в своих свойствах и явлениях человеческого мозга. Еще П.К. Анохин отмечал, что «эта повторяемость явлений в окружающем мире обусловила развитие и наличие способности мозга к предвидению будущих результатов» [1].

В настоящее время авторами проводится работа по созданию на основе предложенного математического аппарата компьютерной автоматизированной системы. Такая система должна позволить смоделировать принятие «правильного» управленческого решения в сложных условиях многовариативности.

Литература

1. Анохин П.К. Особенности афферентного аппарата условного рефлекса и их значение для психологии // Вопросы психологии. 1955. № 6. С. 16-38.

2. Витковская Н.Г. Использование технологии проблемного обучения при подготовке журналистов // Вестник Волжского университета им. В.Н. Татищева. 2013. Т. 2. № 4[14]. С. 77-84.

3. Витковская Н.Г К вопросу о формировании информационной компетентности будущих журналистов в процессе их обучения в вузе // Вестник Волжского университета им. В.Н. Татищева. 2013. № 3[13]. С. 79-88.

4. Витковская Н.Г. Информационная компетентность студентов как одно из условий индивидуального обучения // Вестник Волжского университета им. В.Н. Татищева. 2015. № 2[18]. С. 70-78.

5. Крайнюков Н.И. Обратимые конечные автоматы и условия вложения полугруппы в группу // Вектор науки Тольяттинского государственного университета. 2010. № 3. С. 34-36.

6. Мельников Б. Ф. Применение мультиэвристического подхода в задаче вершинной минимизации недетерминированных конечных автоматов / Б. Ф. Мельников, С. В. Пивнева, А. В. Цыганов / / Нейроинформатика, ее приложения и анализ данных : материалы XVII всерос. семинара (ИВМ СО РАН, 2-4 октября 2009 г.). -Красноярск, 2009. - С. 73-78.

7. Мельников Б. Ф. Эвристические алгоритмы принятия решений в гуманитарных областях / Б. Ф. Мельников, С. В. Пивнева // Известия Самарского научного центра Российской академии наук. Вып. 8. - Самара : Изд-во Самарского научного центра РАН, 2009. - С. 137-143.

8. Пивнева С. В. Математическое моделирование процесса обучения // Проблемы университетского образования: содержание и технологии : труды II всерос. науч.-метод. конф. - Тольятти : Тольят. гос. ун-т, 2005. - С. 67-71.

9. Пивнева С. В. Принятие решений в гуманитарных областях - подходы к репрезентативности входных данных и сравнению эффективности алгоритмов / / Информационные технологии моделирования и управления. - № 8 (51) - Воронеж : Изд-во «Научная книга», 2008. - С. 888-896.

10. Пивнева С. В., Мельников Б. Ф. Мультиэвристический подход применительно к задачам дискретной оптимизации // Методы и средства обработки информации : труды Третьей всерос. науч. конф. (ВМК МГУ 6-8 октября 2009 г.). - М., 2009. - С. 268-280.

11. Пивнева С.В. Минимизация недетерминированных конечных автоматов по различным критериям // Вектор науки Тольяттинского государственного университета. 2011. № 1. С. 19-21.

12. Словарь практического психолога / Сост. С. Ю. Головин. - Минск: Харвест, 1998. - 800с.

13. Судаков К.В. Системное квантование жизнедеятельности // В кн. Системокванты физиологических процессов. М. 1997. С. 9-53.

14. Умрюхин Е. А. Целенаправленное поведение и самообучение живых организмов // Изв. РАН. ТиСУ - 2003. - № 3. -С. 114-124.

15. Умрюхин Е.А., Судаков К.В. Теория хаоса: преобразующая роль функциональных систем // Российский физиологический журнал им. И.М. Сеченова. Т.83, № 5-6, 1997. С.190-216.

i Надоели баннеры? Вы всегда можете отключить рекламу.