Научная статья на тему 'Системные аспекты организации и применения мультилингвистической адаптивно обучающей технологии'

Системные аспекты организации и применения мультилингвистической адаптивно обучающей технологии Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
410
91
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МУЛЬТИЛИНГВИСТИЧЕСКИЙ ПОДХОД / АДАПТИВНАЯ МОДЕЛЬ / СИСТЕМНАЯ АРХИТЕКТУРА / ЧАСТОТНЫЙ ТЕРМИНОЛОГИЧЕСКИЙ СЛОВАРЬ / АДАПТИВНО-ОБУЧАЮЩАЯ ТЕХНОЛОГИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ковалев И. В., Карасева М. В., Суздалева Е. А.

Рассматриваются системные аспекты организации мультилингвистической адаптивно-обучающей технологии и ее применение для изучения многоязычной терминологической лексики. Представлено информационно-терминологическое обеспечение указанной технологии, реализованное с учетом ориентации на первичность архитектурного слоя правил, соответствующего функциям адаптивной модели обучения и многоязычному терминологическому базису.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ковалев И. В., Карасева М. В., Суздалева Е. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Системные аспекты организации и применения мультилингвистической адаптивно обучающей технологии»

Educational Technology & Society 5(2) 2002 ISSN 1436-4522

Системные аспекты организации и применения мультилингвистической адаптивно - обучающей

технологии

И.В. Ковалев1, М.В. Карасева2, Е.А. Суздалева2 1 Красноярский государственный технический университет [email protected] 2Сибирская аэрокосмическая академия

АННОТАЦИЯ

Рассматриваются системные аспекты организации мультилингвистической адаптивно-обучающей технологии и ее применение для изучения многоязычной терминологической лексики. Представлено информационнотерминологическое обеспечение указанной технологии, реализованное с учетом ориентации на первичность архитектурного слоя правил, соответствующего функциям адаптивной модели обучения и многоязычному терминологическому базису.

Ключевые слова

мультилингвистический подход, адаптивная модель, системная архитектура, частотный терминологический словарь, адаптивно-обучающая технология.

Введение

Адаптивно-обучающая технология развивается в рамках современного подхода к проблеме обучения, который был предложен Гордоном Паском [Паск Г., 1970] и развит профессором Л.А. Растригиным [Растригин Л.А., Эренштейн М.Х., 1988]. Отношения между учеником и учителем рассматриваются, как отношения между объектом управления и управляющим устройством, что позволяет использовать методы теории управления [Растригин Л.А. 1985]. Так как построение точной модели сложного объекта практически невозможно, необходимо построить приближенную модель и адаптировать ее параметры для обеспечения ее адекватности реальному объекту (обучаемому). Именно этот подход, реализуемый для мультилингвистической [Ковалев И.В., Усачев А.В., 2001] адаптивно-обучающей технологии (МЛ-технологии), и рассматривается авторами. Основным прикладным аспектом технологии является решение практической задачи изучения терминологической лексики иностранных языков и интенсивного накопления профессионально-ориентированной лексики обучаемого, так как именно с этими проблемами наиболее часто сталкиваются специалисты, работающие с иностранной литературой, и студенты, слушающие лекции на иностранных языках.

Прежде всего, необходимо четко обозначить ряд задач, которые предполагается рассмотреть в данной статье. Задача изучения иностранных языков может быть поделена на множество подзадач, а именно: изучение грамматики, изучение лексики, отработка произношения, формирование навыков говорения, аудирования, чтения и письма, и, наконец, развитие речевой и коммуникативной компетенции обучаемого. Решение всех этих подзадач с помощью компьютерных технологий в своей целостности и формирует компьютерную обучающую среду как интегрированное средство изучения языка [Бовтенко М. А., 2000]. Нами

рассматривается задача изучения терминологической лексики иностранных языков, а точнее, задача интенсивного накопления профессионально-ориентированного активного словаря обучаемого, так она является одной из проблем, с которой наиболее часто сталкиваются специалисты и студенты, работающие с иностранной литературой или слушающие лекции на иностранных языках.

1. Мультилингвистическая адаптивно-обучающая технология

В работе [Растригин Л.А., Эренштейн М.Х., 1988] показано, что одним из путей решения задачи изучения профессионально-ориентированной иностранной лексики является использование алгоритма обучения, работающего на основе адаптивной модели обучаемого, учитывающей индивидуальные факторы процессов запоминания и забывания каждого конкретного обучаемого.

Применение информационной мультилингвистической обучающей технологии способствует более эффективному использованию указанного алгоритма обучения, позволяя, кроме того, интенсивно пополнять профессиональноориентированный активный словарь одновременно нескольких языков. Рассматриваемая ниже схема иллюстрирует формальное установление ассоциативных связей между терминами различных языков, но не учитывает ассоциативных связей между словами одного языка.

Итак, формально человеческую память можно представить в виде совокупности огромного количества ячеек. Множество ячеек для слов родного языка человека обозначим

KN = \kl, ^, kN },

где каждая из ячеек содержит слово родного языка.

При изучении первого иностранного языка (например, английского) вследствие пополнения словарного запаса в памяти генерируется новое множество ячеек для запомненных слов английского языка

KE = {к1, • • •, kE };

В дальнейшем при актуализации /-го слова на русском (родном) языке в памяти возникают ассоциации с его английским значением

А™, / = 1, к, N .

Ассоциация - связь между двумя психическими элементами, возникшая в результате опыта и обусловливающая при актуализации одного элемента связи проявление и другого. Очевидно, что степень их связи может быть различной в зависимости от скорости восприятия и забывания, времени забывания слова после его последнего заучивания и индивидуальных особенностей памяти человека.

При изучении второго иностранного языка (например, немецкого) через определенный промежуток времени в памяти возникают все новые ячейки для запомненных немецких слов, множество которых обозначим

Ко = {kl, ■-, ко }.

Множество К0 частично перекрывает множество запомненных английских слов КЕ, так как число элементов множества КЕ в зависимости от времени после последнего заучивания уменьшается. Выражая объем памяти как функцию времени, зависимость можно четко проследить: даже отлично выученные иностранные слова забываются с течением времени (рис. 1). Новые запомненные немецкие слова занимают бывшие «английские» ячейки, которые к тому моменту становятся пустыми. При этом необходимо отметить, что ячейки, зарезервированные для слов родного языка, остаются неизменными. Механизмом, лежащим в основе этой закономерности, выступает перевод информации из кратковременной памяти в долговременную.

Возникают также новые ассоциации слов родного языка с их немецкими значениями

Аш, / = 1, к, N,.

Степень их связи может варьироваться вследствие различных скоростей восприятия и забывания слов, времени их забывания после последнего заучивания, вплоть до перекрывания ассоциаций с английскими значениями слов.

Рис. 1. Изменение общего объема обучающей информации при ее накоплении и забывании

При попытке вспомнить английское либо немецкое значение слова осуществляется поиск двух разных ячеек из обоих множеств Ко и КЕ. Поиск ячеек довольно сложен вследствие того, что ассоциации со словами немецкого языка, который изучался позднее, гораздо сильнее, и могут затмить ассоциации с английскими словами. Происходит своеобразный конфликт ассоциаций, и «победа» одной из них (не обязательно требуемой в данный момент) на этом уровне зависит от индивидуальных особенностей памяти человека.

При применении информационной мультилингвистической обучающей технологии значения слова на всех изучаемых одновременно иностранных языках хранятся в одной и той же ячейке и фиксируются в ней одновременно. При этом время, прошедшее после заучивания, для них является одинаковым. Значения скоростей забывания могут несущественно отличаться вследствие такого субъективного фактора, как индивидуальные особенности памяти человека, но остальные факторы, связанные со скоростью забывания (выдача для заучивания, начальные значения скорости забывания), будут одинаковы для обоих слов. Возникают так называемые множественные ассоциации в зависимости от числа изучаемых одновременно иностранных языков. Для рассматриваемого примера это будут троичные ассоциации с английскими и немецкими значениями слов:

А^ш, / = 1, к, N.

Соответственно, процесс обращения к множеству ячеек происходит один раз, и ассоциации не конфликтуют.

Ассоциативный параметр, выражающий степень связи -го слова родного языка и его значений на двух иностранных языках, может быть представлен следующим образом:

(Атс° ) = ! _ е-уоП . (1)

где у0 - скорость восприятия информации обучаемым; п -число сеансов обучения (уроков);

Мп

^0 =■

лтп

(2)

где Мп - объем очередной порции обучающей информации ип; Тп -продолжительность п-го сеанса обучения; 0<Л<1 - коэффициент потери информации во время ее поступления в память.

Изменение общего объема обучающей информации при ее накоплении (т. е. во время периода обучения) и забывании представлено на рис. 1.

В работе [Ковалев И.В., Ступина А.А., Суздалева Е.А., 2001] в качестве основных компонентов информационно-алгоритмического обеспечения

мультилингвистической обучающей технологии определяются компьютерные системы, реализующие адаптивный алгоритм обучения терминологической лексике, и электронные частотные словари, построенные по мультилингвистическому принципу. Необходимо выделить ряд основных достоинств работы такой компьютерной системы:

1. учитывается фактор частотности слов (т.е. для наиболее быстрого и эффективного обучения заучивается не весь словарь, а в первую очередь та его часть, которая чаще других употребляется в тексте);

2. учитывается индивидуальная специфика памяти человека (т.е. повторяются не все слова подряд, а те, которые хуже запоминаются или быстрее забываются);

3. промежутки между сеансами обучения произвольны, что особенно важно для применения системы в реальной обстановке;

4. учитывается отличие объема очередной порции обучающей информации на каждом сеансе от общего ее объема;

5. мультилингвистичность обеспечивает генерацию ассоциативного поля вокруг запоминаемых понятий;

6. учитывается такое важное свойство человеческой памяти, как уменьшение скорости забывания обучающей информации по мере ее повторения.

Следует учитывать, что модель обучаемого, которая используется в реализации алгоритма, является результатом исследований в области психологии. Это экспоненциальная зависимость вероятности незнания лексической единицы от скорости ее забывания, степени ее связи с иностранными значениями и времени с момента ее последнего заучивания. В процессе обучения происходит адаптация к особенностям памяти конкретного обучаемого таким образом, чтобы обучать его с максимальной для него скоростью и генерировать порции обучающей информации, оптимальные только для него. При этом система на каждом шаге минимизирует близость ученика к заданной цели обучения, что означает: такое обучение будет оптимально на каждом шаге. Это, разумеется, не гарантирует оптимальности всего процесса обучения, но дает возможность получить решение, достаточно близкое к оптимальному.

Таким образом, одним из путей решения поставленной задачи является использование алгоритма обучения, работающего на основе адаптивной модели обучаемого, в которой учитываются индивидуальные факторы процессов запоминания и забывания каждого конкретного обучаемого. Применение мультилингвистической адаптивно-обучающей технологии способствует более эффективному использованию алгоритма обучения за счет формирования ассоциативного поля вокруг запоминаемых понятий, что позволяет более интенсивно пополнять профессионально-ориентированный активный словарь одновременно нескольких языков.

2. Системные аспекты организации МЛ-Технологии

Реализация новой мультилингвистической адаптивно-обучающей технологии требует разработки программно-алгоритмического обеспечения компьютерных систем обучения, внедряемых в практику создания интерактивных средств обучения иностранной терминологической лексике. При создании таких компьютерных систем, в первую очередь, необходимо решить следующие задачи: провести структурный системный анализ информационной базы МЛ-технологии; сформировать информационную модель МЛ-технологии на основе концепции трехслойной системной архитектуры (рис. 2); разработать адаптивную модель обучаемого, учитывающую особенности мультилингвистического подхода; разработать и проанализировать алгоритм обучения, который осуществляет

адаптацию параметров обучаемого с учетом ассоциативных параметров мультилингвистической модели.

Как правило, в центре любой методологии находится некоторая системная архитектура, и лишь затем совокупность стратегий и методов анализа и проектирования. В [Гейн К., Сарсон Т., 1992] отмечается, что архитектура современных систем является трехслойной и имеет следующие характеристики:

— четко определенные слои;

— формальные и явные интерфейсы между слоями;

— скрытые и защищенные детали внутри каждого слоя.

В соответствии с указанными требованиями системная архитектура мультилингвистической адаптивно-обучающей технологии будет иметь следующий вид, представленный на рисунке 2.

Три слоя (база данных, правила, сеанс обучения) отражают возрастание уровня абстракции в рассматриваемой системной архитектуре. Наиболее детальным слоем является база данных, более высокий уровень абстракции - слой правил, наивысший уровень абстракции - слой сеансов обучения. В данной архитектуре слой правил является относительно новой концепцией, ориентированной на мультилингвистический подход и соответствующей функциям адаптивной модели обучения в рамках многоязычного терминологического базиса [Карасева М.В., Ковалев И.В., Суздалева Е.А., 2002]. Процессы данного слоя отражают:

— выполнение требуемых задач (построение модели памяти обучаемого, адаптация модели и т.д.);

— принятие решений;

— запуск других задач в слое “правил” и других слоях.

Независимость слоев трехслойной системной архитектуры обеспечивает

следующие основные преимущества:

— улучшение базы данных - отделение БД от изменений в технологиях и алгоритмах обучения, а следовательно, поддержка согласованности и осмысленности данных в течении длительного периода времени существования МЛ-Технологии;

— гибкость интерфейсов пользователя - изменение интерфейсов без влияния на процессы технологии и алгоритмизации обучения и наоборот;

— разделение усилий коллектива разработчиков.

Предлагаемая трехслойная архитектура (а именно, выделение слоя правил) требует модификации существующих методологий, применяемых для анализа и проектирования мультилингвистических обучающих систем. Это относится, в первую очередь, к информационно-ориентированным методологиям и методологиям, ориентированным на данные. Такие методологии имеют следующие две характеристики, нуждающиеся в модификации:

— информационная модель (и база данных) рассматриваются как центральные понятия при анализе и проектировании;

— функциональная модель (а следовательно, и слой правил) является некоторым дополнением к информационной модели.

Согласно такому подходу, информационная модель является первичной, занимает центральное место и регламентирует весь процесс анализа и проектирования, что приводит к следующим ограничениям;

— построенная на ее основе функциональная модель либо является слабо связанной с информационной моделью, либо не адекватно отражает существующие процессы и правила обучения;

— сама по себе информационная модель является недостаточной (хотя и одной из самых важных) для решения задач мультилингвистической информационной технологии;

— информационная модель плохо понимается неспециалистами, поэтому попытки вовлечь филологов, лингвистов и специалистов по лингводидактике в разработку обречены на неудачу.

С другой стороны, указанные специалисты прекрасно ориентируются в обучающих и образовательных технологиях, в методах лингводидактики. Например, функциональные диаграммы (на базе диаграмм потоков данных) интуитивно понимаемы неспециалистами.

Таким образом, в центре современной мультилингвистической информационно-обучающей технологии лежат два взаимосвязанных (и, фактически, равных по важности) компонента - информационная база и процесс (технология) обучения. Однако, целесообразно считать, что основным центром является процесс (модели, алгоритмы, методы), а информационная база - менее важный из двух центров, то есть, процесс становится первичным и во многом определяет проект системы. Модель процесса, в первую очередь, важна для системной разработки мультилингвистической технологии. Тем не менее, информационная модель продолжает оставаться неотъемлемой и важной и соответствующим образом влиять на разрабатываемую функциональную модель.

В таблице 1. представлена трехслойная системная архитектура МЛ-технологии в разрезе регламентируемых современной структурной методологией [Марка Д. А., МакГоун К., 1993] этапов разработки (анализ требований,

проектирование, реализация). ________________________________________________

Слои Анализ Проектирование Реализация

Сеанс обучения Поток сеансов Поток интерактивного взаимодействия Диалог “Пользователь-Система”

Правила Поток процессов Модель компонентов Программы

База данных Модель данных Схема базы данных Мультиязычные таблицы терминов, коллекция электронных словарей и т.п.

Табл. 1. Системные этапы трехслойной архитектуры МЛ-Технологии

Анализ требований. В слое сеансов обучения рассматриваются обобщенные потоки между компонентами системы и пользователями разного уровня без подробного описания каких-либо диалоговых форм и интерфейсов. На уровне правил рассматриваются детальные модели требований, отражающие функциональную реализацию мультилингвистического подхода. На уровне базы данных строится концептуальная модель, увязанная с функциональной моделью требований на уровне укрупненных подсхем будущей информационной модели.

Проектирование. На уровне сеанса обучения макетируются последовательности форм интерактивного взаимодействия. На уровне правил осуществляется детальное проектирование будущих компонентов с привязкой к конкретным сущностям информационной модели. На уровне базы данных концептуальная модель преобразуется в диаграмму “сущность-связь”.

Реализация. На данном этапе проект преобразуется в систему.

Таким образом, мультилингвистическая адаптивно-обучающая технология регламентируется структурной системной методологией и адаптирована для трехзвенной архитектуры прежде всего за счет ее ориентации на первичность слоя правил, соответствующего функциям адаптивной модели обучения в рамках многоязычного терминологического базиса.

З. Информационно-терминологическое обеспечение МЛ-Технологии

Для достижения целей, поставленных при формировании информационнотерминологической базы мультилингвистической обучающей технологии [Ковалев И.В., Ковалева Т.А., Суздалева Е.А., 2001], в первую очередь, необходимо разработать электронные частотные мультилингвистические словари для различных областей знаний. Так как эти словари представляют собой словарную базу разрабатываемых компьютерных систем изучения терминологической лексики иностранных языков, то правильность их составления (выбор терминов) и определение частотных характеристик терминов существенно влияет на эффективность работы системы обучения. Указанные характеристики входят в состав модели обучения и непосредственно влияют на качество процесса обучения [Карасева М.В., 1994].

Особенностью информационно-терминологической базы (ИТБ) МЛ-технологии является, прежде всего, многоязычность (мультилингвистичность) терминологических понятий. Это приводит к тому, что базисный информационный компонент МЛ-технологии идентифицирует совокупность потоков данных, детализирующих процессы, реализующие функции системы обучения в зависимости от свойств конкретных языков, свойств памяти обучаемого, частотности употребления терминов и т. д.

В рамках средств структурного анализа, эффективно применяемых в информационных системах, важное место занимают словари данных, организация которых в МЛ-технологии также имеет свои особенности из-за мультилингвистического характера базисных компонентов. Однако, следуя методологии структурного анализа и применяя DFD (Data Flow Diagrams) [Марка Д.А., МакГоун К., 1993], можно показать внешние по отношению к системе источники и стоки (адресаты) данных, идентифицировать логические функции (процессы) и группы элементов данных, связывающие одну функцию с другой (потоки), а также идентифицировать хранилища (накопители) данных, к которым осуществляется доступ при реализации функций МЛ-технологии. Структуры потоков мультилингвистических данных и определения их базисных компонент хранятся и анализируются в МЛ-словаре данных, что требует его специальной организации.

Как правило, словарь данных представляет собой определенным образом организованный список всех элементов данных системы с их точными определениями (для МЛ-словаря, следовательно, определения должны быть многоязычными), что дает возможность различным категориям пользователей (от системного аналитика, алгоритмиста до специалиста по компьютерной

лингводидактике) иметь общее понимание всех входных и выходных потоков и компонент хранилищ. Определения элементов данных в словаре осуществляются следующими видами описаний:

— описанием значений потоков и хранилищ, изображенных на DFD;

— описанием композиции агрегатов данных, движущихся вдоль потоков, то есть, комплексных данных, которые могут расчленяться на элементарные символы (например, для МЛ-словаря любой термин или базисный информационный компонент может содержать на уровне сеанса обучения такие символы, как терминологическое множество других языков, множество частотных характеристик терминов и т.д. [Карасева М.В., 1994]);

— описанием композиции групповых данных в хранилище (например, на каждом сеансе базисному информационному компоненту МЛ-словаря ставится в соответствие композиция альтернативных многоязычных терминов и многоязычных подсказок; мощность группы данных определяется алгоритмами, реализуемыми в МЛ-технологии обучения);

— специфицированием значений и областей действия элементарных фрагментов информации в потоках данных и хранилищ;

— описанием деталей отношений между хранилищами.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Современные программно-алгоритмические средства разработки

компьютерных обучающих систем требуют применения оригинальных методик при формировании информационной модели данных, используемых при обучении [Ковалев И.В., Ковалева Т.А., Суздалева Е.А., 2001]. Разрабатываемые авторами методики базируются на основных идеях структурного системного анализа и на структурных методологиях, относящихся к классу методологий, ориентированных на данные. С позиций ориентированных на данные методологий вход и выход информационной модели являются наиболее важными, структуры данных (а не потоки данных) определяются первыми, а компоненты обучающих процедур технологии строятся как производные от структур данных.

Так терминологическое множество, соответствующее базисному информационному компоненту мультилингвистической обучающей технологии, может быть описано следующим образом:

МЛ-компонент = {термин яз_1, термин яз_2,..., термин яз_N, частота яз_1, частотаяз_2,..., частотаяз_Щ.

DSSD использует аналогичную нотацию, а именно множественную скобку (рис. 3).

МЛ-компонент

термин яз_1 термин яз_2

термин яз_N частота яз_1 частота яз_2

частота яз N

Рис. З. Описание базисного информационного компонента с использованием нотации DSSD

Таким образом, основные этапы методологии с помощью диаграмм Варнье-Орра [Марка Д.А., МакГоун К., 1993] позволяют определить логику обработки данных, фактически, продуцируя структуру программ обработки с целью реализации обучающих алгоритмов МЛ-технологии.

Одним из важных этапов работы по развитию информационнотерминологической базы является формирование информационной модели данных для новой мультилингвистической информационно-обучающей технологии, реализующей адаптивные процедуры. Рассмотрим для указанной технологии информационно-логическую организацию данных и базовые конструкции диаграмм Варнье-Орра.

Как показано в [Ковалев И.В., Усачев А.В., 2001], особенностью

информационной базы мультилингвистической адаптивно-обучающей технологии является многоязычность или мультилингвистичность терминологических понятий. Базисный информационный компонент МЛ-технологии, являясь основой информационной модели данных для МЛ-технологии, идентифицирует совокупность потоков данных, которые детализируют процессы и функции системы обучения в зависимости от свойств конкретных языков, свойств памяти обучаемого, частотности употребления терминов и т. д.

Средства программно-алгоритмической поддержки компьютерных адаптивно-обучающих систем используют оригинальные методики при формировании информационной модели данных, которые используются при обучении. В основу методики положены основные идеи структурного системного анализа и структурные методологии, которые относятся к классу методологий, ориентированных на данные. Для таких методологий вход и выход информационной модели являются наиболее важными. Первыми определяются структуры данных, а не потоки, и, следовательно, компоненты обучающих процедур МЛ-технологии строятся как производные от структур данных.

Конструкции диаграмм Варнье-Орра [Марка Д.А., МакГоун К., 1993] очевидны из следующего примера, приведенного на рисунке 4. В данном примере применены две базовых конструкции диаграмм Варнье-Орра: иерархия и

последовательность. Согласно рисунку (рис. 4) они могут интерпретироваться следующим образом: МЛ-технология содержит в качестве первого этапа - выбор сеансного состава МЛ-компонентов, в качестве второго этапа - определение характеристик и требований, в качестве третьего этапа - обучение.

выбор сеансного состава МЛ-компонентов

альтернативное формирование ИБ МЛ-технологии; ранжирование ИБ; выбор ИБ;

характеристики и требования

на логическом уровне

на физическом уровне

частота яз_1, 2,....N обученность скорость забывания

модель памяти

достигаемая

обученность

обучение

формирование альтернативного термин яз_1;

терминологического ряда .......... ;

термин яз_^

адаптация модели

алгоритм;

процедура;

результат

приложения.

Рис. 4. Диаграмма Варнье-Орра для основных этапов МЛ-Технологии

Предлагаемая информационно-логическая организация МЛ-технологии, фактически, содержит этапы обработки информации. Например, при выборе сеансного состава МЛ-компонентов ставится задача непосредственной реализации словаря в виде мультилингвистической базы данных, включающая в себя:

1. альтернативное формирование БД (с учетом соотношений терминов и их частот);

2. ранжирование БД (отбор наиболее употребительных терминов);

3. выбор сформированной БД для сеанса обучения.

4. На логическом уровне второго этапа определяются требования к частоте и обученности, а также характеристики, включающие начальные значения скорости забывания терминов.

На физическом уровне второго этапа строится модель обучаемого и задается уровень достигаемой (в реальной обстановке) обученности.

На этапе обучения формируется альтернативный набор терминов, образующий порцию обучающей информации. Формирование альтернативного терминологического ряда также находится на логическом уровне обработки информации. На физическом же уровне этапа обучения происходит адаптация параметров модели обучаемого согласно алгоритму обучения, пошаговой процедуре, и в итоге, в зависимости от результата обучения (значения критерия обучения).

Таким образом, нами показана логика обработки данных для МЛ-технологии, определяемая с помощью диаграмм Варнье-Орра, и поддерживаемая программноалгоритмическими средствами, описание которых дается ниже.

4. Применение МЛ-Технологии при разработке системы изучения терминологической лексики

Базовым методом является подход Л.А.Растригина [Растригин Л. А., 1985], при котором процесс обучения рассматривается как процесс управления сложным объектом. В этом случае ученик выступает в качестве объекта управления, а учитель или обучающее устройство - в качестве источника управления, т.е. управляющего устройства. Схема процесса обучения изображена на рисунке 5. “Учитель” подает на вход “ученика” порцию обучающей информации и; У - состояние “ученика”, подаваемое на датчик (в роли датчика может выступать, например, контрольная работа или опрос на семинаре, т.е. тест); У’ - информация о состоянии “ученика”, получаемая “учителем”. “Учителю” сообщаются цели обучения 2* и ресурсы Я, которыми он располагает для обучения.

Рис.5. Схема процесса обучения

В качестве модели обучаемого предлагается модификация адаптивной модели Л.А.Растригина применительно к мультилингвистической адаптивно-обучающей технологии [Kovalev I., Kovaleva T., Souzdaleva E., 2000]. Как и в работах Растригина Л.А. нами используется широко распространенная аппроксимация процессов обучения монотонной экспоненциальной кривой, однако, учитывая, что во многих экспериментах [Венда В.Ф., 1990] выявлено несовпадение реального процесса обучения с экспоненциальной кривой, система обучения предполагает расширение базиса моделей и возможность работы с экспериментальными данными для построения реальных зависимостей.

Состояние обучаемого на п-ом сеансе описывается вектором вероятностей незнания каждого из элементов обучающей информации (ОИ):

У„ = Р„ = (Р1П, Р2П, Рм), (3)

где р" - вероятность незнания /-го элемента в п-й момент времени ґ„. Вероятности незнания элементов ОИ изменяются по правилу

а„і„

Р„ = РЮ = 1-е-'а/1/ , (4)

где а1п - скорость забывания і-го элемента ОИ на п-м сеансе с учетом его связи с элементами ранее изучавшихся иностранных терминологий; ґ„ - время с момента последнего заучивания /-го элемента ОИ. Скорость забывания каждого элемента уменьшается, если этот элемент выдается обучаемому для запоминания, и не изменяется, если он не заучивается : а/, если 1 й И,

аіп+1 =

I „ т—г • тт пі

у а. ґ„ , если і є И и г = 1,

п 1 (5)

„ „ ЫЕв • п ас ' '

у а і г„ , если і є Ип и г = 0,5,

п

у"'а"Рпшв, если 1 е ип и г" = 0, п = 1,2,....,

где а11 - начальное значение скорости забывания, оцениваемое методом максимального правдоподобия по выражению (6), 0<а11<1, (/ = 1, 2, ..., Ы), х - число незапомненных терминов из порции ип объемом Мп, впервые заучиваемых;

а л М п — х .

а=-'п~МТ■ <6)

п

У’, У”, У”’ " параметры коррекции скоростей забывания, характеризующие индивидуальные особенности памяти обучаемого, оцениваемые методом

максимального правдоподобия, 0<у’<1, 0<у”<1, 0<у”’<1.

Ответ обучаемого на тесты Яп = (г/, гМпп):

1, если обучаемый не вспомнил термины на 2 - х языках ;

0.5, если не вспомнил термин хотя бы на одном языке ; (

0, если ни одного термина не забыл .

Критерием качества обучения Qn необходимо выбрать такой, который характеризует уровень обученности обучаемого. Для рассматриваемой задачи

данный уровень характеризуется вероятностью незнания элемента ОИ, наугад выбранного из текста:

N

^ =£ Р/ 0Г )Чг ^ т1п; (8)

/=1

гдер"(^) - вероятность незнания /-го элемента ОИ; qi- относительная частота, выражающая долю лексической единицы в тексте, подвергшемуся статистической обработке при составлении частотного словаря, 0^- <1,

qmax

Чг =ъ—; (9)

чг у

где qimax=max q{qiI, qi2, qi3} - абсолютная частота появления лексической единицы в тексте, qil, qi2, qiз -частоты из мультилингвистического словаря соответственно при английском, немецком и русском слове, у - объем текста при составлении частотного словаря (У=30000 слов для словарей, подключаемый к системе по умолчанию).

Для минимизации значения Qn к концу сеанса обучения естественно в порцию ОИ включать элементы, имеющие наибольшее значение произведения pi(tгn)qi, так как в результате их запоминания произведение становится равным нулю и тем самым наибольшим образом снижает значение Qn.

Таким образом, для обеспечения оптимального значения Qn к концу п-го сеанса обучения, необходимо найти Мп максимальных членов суммы в критерии, индексы которых и определят очередную порцию ОИ, выдаваемую ученику для запоминания. Процедура поиска индексов для терминов записывается в виде

системы (10), где arg max{a,} = i* - индекс i*eU максимального значения ai,, т.е. ai* = max ai, и, таким образом, {u1y uMn} - это та порция ОИ, которая выдается для заучивания на n-м сеансе. Объем этой порции зависит от продолжительности n-го сеанса обучения Tn, или времени, отведенного на заучивание порции Un.

u1 = arg max pi (t n ) qt;

1<i < N

u2 = arg maxpi (tn )qi;

T (10)

uMn = argmax Pi (ti )qi;

n 1<i<N

i * uj (j = 1 2 ■■■, Mn - 1),

Предполагается, что время заучивания /-го элемента прямо пропорционально вероятности его незнания, т.е. очевидно, что чем меньше вероятность незнания элемента, тем меньше времени необходимо на его заучивание. Тогда объем Мп очередной порции ип определяется из следующего соотношения:

Mn = m?x\M : Tn I рг (ti) [, (11)

1<М <Ы , —

I ге{м1,...,мм I

где к - среднее время заучивания элемента ОИ при первом его предъявлении ученику; их, ..., иМ - номера элементов ОИ, определяемых с помощью процедуры (10). Параметр к априорно неизвестен и поэтому должен оцениваться адаптивно в процессе обучения в зависимости от времени, затрачиваемого обучаемым на выполнение порции ОИ:

Кп+1 = Кп + Ц(Т\ -Тп ), (12)

где ц - коэффициент скорости адаптации, а Т’п - время, затраченное учеником на заучивание Пп.

Обучение заканчивается, когда Qn достигает требуемого уровня обученности

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Число сеансов обучения п, за которое достигается Qn < 5, определяет продолжительность обучения.

Таким образом, можно выделить следующие этапы алгоритма обучения:

1. Производится проверка знания обучаемым порции ОИ, в результате которой строится множество ответов обучаемого на тесты согласно выражению (7).

2. Осуществляется адаптация параметров модели обучаемого по правилу (5) с учетом выражений (1) и (2).

3. Корректируется вектор вероятностей незнания элементов ОИ, т.е. формируется Рп+1, согласно выражениям (4) и (5) и с учетом времени забывания информации после ее последнего заучивания Ъп:

п+1 \^п,если i еип;

С = 1 (13)

и” + Ы , если i & и , п = 0,1,...

1,^ п * п ' * *

4. Вычисляется рп+1 согласно выражению (8).

5. Если рп+1 < 5, то обучение заканчивается. При рп+1 > 5 определяется очередная порция ОИ Цп+1 по выражению (10), которая с учетом соотношений (11) и (12) выдается для заучивания.

Авторами проводился эксперимент сопоставления предлагаемой модели обучаемого с известными моделями обучения. Эксперимент сопоставления заключался в следующем:

1. построение плана эксперимента, адекватного всем моделям;

2. получение экспериментальной кривой обучения, точки которой определяют долю неправильных ответов на каждом шаге обучения;

3. оценка параметров моделей по экспериментальным данным и построение теоретической кривой обучения для каждой модели;

4. оценка степени близости теоретической кривой обучения к экспериментальной по выбранному критерию;

5. выбор модели, наилучшим образом описывающую процесс обучения. Для эксперимента были выбраны модели обучения Растригина, Буша-

Мостеллера, Миллера-Мак-Гилла, Терстоуна, Рестла и Кричевского. Теоретические кривые обучения были построены для всех моделей и собраны на одном графике. Степень близости теоретической кривой обучения каждой модели к экспериментальной оценивалась следующим образом:

© (п )- М © ( )(п )| , (14)

где I - номер модели; / = 1, 2, ..., 7; К=8; ©(п) - точки на экспериментальной кривой; М©(1)(п) - точки на теоретической кривой обучения, полученной с помощью 1-й модели. Полученные результаты показывают, что МЛ-адаптивная модель достаточно хорошо согласуется с экспериментальными данными, т. е. по сравнению с известными моделями точки на теоретической кривой обучения указанной модели располагаются ближе к точкам на экспериментальной кривой (табл. 2).

Номер модели Модель Р

1 МЛ-адаптивная 0.124

2 Адаптивная 0.135

3 Буша - Мостеллера 0.406

4 Миллера - Мак-Гилла 0.893

5 Терстоуна 0.458

6 Рестла 0.160

7 Кричевского 0.697

Табл. 2. Результаты эксперимента

В качестве реализация программно-алгоритмического и информационного обеспечения МЛ адаптивно-обучающей технологии представим компьютерную систему для обучения иностранной профессионально-ориентированной лексике “Virtual Teacher 1.0”, концептуальная схема которой приводится на рисунке 6.

Программное обеспечение реализовано на языке С++ с использованием среды быстрого программирования приложений Borland C++ Builder 5.0, что позволило наиболее полно раскрыть потенциал МЛ технологии, а также наиболее качественно разработать интерфейс пользователя для работы в операционной системе Windows’9X/2000.

Кроме блока обучения, непосредственно отвечающего за организацию сеансов обучения, пользователь имеет возможность работать с дополнительным блоком двуязычного тестирования для оценки своих знаний и определения в выборе языка подсказок. С блоком БД, который включает в себя коллекции МЛ частотных словарей, пользователь непосредственно не связан, так как ему предоставляется возможность выбора словаря в блоке обучения при настройке системы. Кроме того, имеется возможность расширения БД за счет подачи профессиональноориентированных текстов в блок статистической обработки текстов, в котором обновляется набор терминов и частот.

Рис.б. Концептуальная схема системы

Последовательность работы с системой “Virtual Teacher 1.0” приведена на рисунке 7. К системе возможно подключение частотных словарей различной тематики, выполненных в формате системы, что и отражено в блоке 2.

Рис.7. Последовательность работы с системой

В системе существует возможность сохранения данных пользователя и возвращения к прерванному сеансу обучения. Коэффициент обучения пользователя отображается в реальном времени. При достижении пользователем требуемого уровня обученности система рекомендует выбор очередного сеансного словаря.

Пользователь имеет возможность обновлять словари, подключать к системе новые словари, а также создавать свои собственные. Существует возможность параллельного использования отдельного программного модуля, включающего функции конкорданса (счетчика частот). При загрузке новых специально отобранных текстов указанный программный модуль обновляет частоты и учитывает новый общий объем выборки.

Таким образом, при тщательном подборе комплекса программ, а именно, программ обучения другим языковым навыкам, например, редактора текста со встроенной программой проверки орфографии, браузера Интернет, тривиальных электронных словарей и энциклопедий (особенно с интерфейсом на изучаемом языке, что обеспечивает более интенсивное погружение в иноязычную среду) существует возможность создания компьютерной обучающей среды как интегрированного средства изучения иностранного языка на базе описанной системы.

Заключение

В статье рассмотрены системные аспекты организации новой мультилингвистической адаптивно-обучающей технологии. Применение авторского подхода позволило более эффективно использовать информационную базу, модель и алгоритмы обучения, обеспечивающие более интенсивное пополнение профессионально-ориентированной лексики одновременно нескольких иностранных языков. Авторами предложена модификация модели и алгоритма обучения, использующая ассоциативный параметр, выражающий степень связи слова родного языка и его значений на других иностранных языках. В качестве апробации подхода

разработана компьютерная система «Virtual Teacher 1.0» для обучения профессионально-ориентированной лексике. В качестве лексической базы системы разработан специальный англо-немецко-русский частотный словарь по системному анализу и системотехнике, который предназначен для студентов, обучающихся по специальностям «Системный анализ» и «Системотехника», а также для переводчиков и специалистов, занимающихся в рамках своей профессиональной деятельности вопросами системного анализа.

Литература

[Бовтенко М.А., 2000] Бовтенко М.А. Компьютерная лингводидактика: Учеб. Пособие.- Новосибирск: Изд-во НГТУ, 2000.

[Венда В.Ф., 1990] Венда В.Ф. Системы гибридного интеллекта: Эволюция, психология, информатика.- М.: Машиностроение, 1990.

[Гейн К., Сарсон Т., 1992] Гейн К., Сарсон Т. Системный структурный анализ: средства и методы. М.: Эйтекс, 1992.

[Карасева М.В., 1994] Карасева М.В. Англо-русский частотный словарь по системному анализу.- Красноярск: САА. 1994.

[Карасева М.В., Ковалев И.В., Суздалева Е.А., 2002] Карасева М.В., Ковалев И.В., Суздалева Е.А. Модель архитектуры мультилингвистической адаптивно-обучающей технологии. Тезисы международной НМК «Новые информационные технологии в университетском образовании». Кемерово: КемГУ и ИДМИ. 2002. С. 204-205. [Ковалев И.В., Ступина А.А., Суздалева Е.А., 2001] Ковалев И.В., Ступина А.А., Суздалева Е. А. Информационно-алгоритмическое обеспечение

мультилингвистической обучающей технологии. Материалы 4-й региональной НМК «Современное образование: массовость и качество». Томск: ТГУСУР. 2001. С. 98-99. [Ковалев И.В., Усачев А.В., 2001] Ковалев И.В., Усачев А.В.

Мультилингвистический метод изучения иностранной терминологической лексики на базе мнемотехнического подхода. Первая Всероссийская научная internet-конференция «Социально-психологические проблемы развития личности». Вып. 4. Тамбов: ТГУ. 2001. С. 57.

[Ковалев И.В., Ковалева Т.А., Суздалева Е.А., 2001] Ковалев И.В., Ковалева ТА., Суздалева Е.А. Программно-технические средства поддержки

мультилингвистической технологии. Материалы 4-й международной конференции «Education Quality EQ-2001». Новосибирск: НГТУ. 2001. С. 286-288.

[Марка Д.А., МакГоун К., 1993] Марка Д.А., МакГоун К. Методология структурного системного анализа и проектирования SADT. М.: Метатехнология. 1993.

[Паск Г., 1970] Паск Г. Обучение как процесс создания системы управления// Кибернетика и проблемы обучения/ Берг А.И. - М.: Прогресс, 1970.- С. 25-86. [Растригин Л.А., 1985] Растригин Л.А. Современные принципы управления

сложными системами.- Рига: Зинатне, 1985.

[Растригин Л.А., Эренштейн М.Х., 1988] Растригин Л.А., Эренштейн М.Х. Адаптивное обучение с моделью обучаемого.- Рига: Зинатне, 1988.- 160 с.

[Kovalev I., Kovaleva T., Souzdaleva E., 2000] Kovalev I., Kovaleva T., Souzdaleva E. Effective Information Training Technology Based on the Learner’s Memory State Model //In: Journal of AMSE Periodicals, Vol. 21, No. 3, 2000. Pp.11-26.

i Надоели баннеры? Вы всегда можете отключить рекламу.