МЕТОД ИСПОЛЬЗОВАНИЯ НЕЙРОСЕТИ КОХОНЕНА ДЛЯ ТЕСТИРОВАНИЯ КАЧЕСТВА ЗНАНИЙ

Нуйкин М.В.

УДК 378.146

Нуйкин М.В. студент 4 курса

факультет информационных систем и технологий Поволжский Государственный Университет Телекоммуникаций и Информатики

Россия, г. Самара

МЕТОД ИСПОЛЬЗОВАНИЯ НЕЙРОСЕТИ КОХОНЕНА ДЛЯ ТЕСТИРОВАНИЯ КАЧЕСТВА ЗНАНИЙ

Аннотация

В статье рассматривается проблема тестирования качества знаний обучающихся с использованием нейронных сетей. Рассмотрен метод анализа ответа на естественном языке с помощью самоорганизующихся карт Кохонена (SOM).

Ключевые слова: нейронная сеть, сеть Кохонена, SOM, тестирование, обучение.

METHOD OF USING THE KOHONEN NEURAL NETWORK FOR THE TEST OF KNOWLEDGE QUALITY

Annotation: the article examines the problem of testing the quality of knowledge of students using neural networks. A method for analyzing the response in natural language using self-organizing Kohonen maps (SOM) is considered.

Keywords: neural network, Kohonen network, SOM, testing, training.

Современное обучение немыслимо без систем автоматизированной проверки знаний. Компьютерные системы контроля знаний приобретают все большую популярность, что объясняется не только их объективностью, но и экономической эффективностью. В последнее время тестовый контроль привлекает все большее внимание педагогов в самых разных сферах как наиболее универсальная форма контроля знаний. Проверка знаний в тестовой форме позволяет преподавателю выявить грубые пробелы в знаниях обучаемого и уделить дополнительное внимание общению по теме, недостаточно изученной для допуска к следующей стадии обучения. Тестовый контроль имеет целый ряд преимуществ: эффективность при самостоятельной работе; объективность в оценке знаний; экономия времени преподавателя; высокая степень дифференциации тестируемых по уровню знаний; возможность индивидуализации процесса обучения; прогнозирование темпа и результата обучения; возможность выявления структуры знаний каждого слушателя для дальнейшего изменения методики обучения. Использование нейронных сетей представляет собой принципиально новый подход к решению задач тестирования и контроля знаний, а также подходит для анализа текстов на естественном языке. Это может максимально приблизить оценивание знаний компьютером к

выводам, которые делает преподаватель при проверке устного или письменного задания.

Одной из современной и гибкой к обучению является нейронная сеть Кохонена. По своей архитектуре она более подходит для обработки естественно-языковых текстов, так как в такой сети все объекты классифицируются, и представляется в виде некоторого вектора, подающего на вход нейронной сети. Количество нейронов во входном слое определяется количеством компонентов этого входного вектора, а количество выходов определяется количеством классов, но возможна ситуация, когда несколько нейронов относятся к одному классу. Весовые коэффициенты являются объектами того же типа, что и входные данные.

Далее вводится функция расстояния между объектами данного типа, в нашем случае, это расстояние Левенштейна. Нейронная сеть Кохонена используется в классическом виде, но вычисление расстояния Левенштейна модифицировано под решение конкретной задачи. Для проведения семантического анализа ответа используется самоорганизующаяся карта (SOM), она состоит из компонентов, называемых узлами или нейронами. Их количество задается аналитиком или меняется в процессе обучения. Каждый из узлов описывается двумя векторами. Первый - вектор веса, имеющий такую же размерность, что и входные данные. Второй вектор представляет собой координаты узла на карте. Обычно узлы располагают в вершинах регулярной решётки с квадратными или шестиугольными ячейками. В более широком смысле весовые коэффициенты могут являться любым объектом, важно, чтобы была определена функция расстояния между этими объектами.

Для вычисления расстояния между предложениями был выбран алгоритм взвешенного расстояния Левенштейна (LD, Levenshtein distance). Самым близким к расстоянию Левенштейна по качеству вычисления расстояния является «расстояние максимальной апостериорной вероятности», в работе [3] приведены эксперименты по вычислению обобщённой медианы слов, и расстояние Левенштейна показало лучшие результаты. LD для строк A и B определяется как LD(A, B) = min{a(i) + b(i) + c(i)}. Здесь строка B получается из строки A путём a(i) замен, b(i) вставок и c(i) удалений символов.

Но этого не достаточно, чтобы построить хорошую систему для вычисления семантического расстояния. Семантическое расстояние — это взвешенное расстояние Левенштейна, где веса операций замены, вставки, удаления и транспозиции символов подобраны таким образом, чтобы учитывать их смысловую значимость в предложении. Для улучшения свойств алгоритма введём понятие веса операции. Очевидно, что человеку свойственно ошибаться, особенно, если это касается написания текста на русском языке, поэтому необходимо оценивать значимость операции «превращения» строки A в строку B. Запишем взвешенное расстояние Левенштейна (WLD): WLD(A, B) = min{pa(i) + qb(i) ++ rc(i)}, где скалярные

коэффициенты р, q и г вычисляются в ходе обучения системы.

Дамерау утверждал, что 80% ошибок при наборе текста человеком являются транспозициями. Если к списку разрешённых операций добавить транспозицию, то такое расстояние называется расстоянием Дамерау -Левенштейна. Данное расстояние обладает следующим недостатком: если вычислить расстояние между совершенно разными короткими словами, то оно оказывается небольшим, в то время как расстояния между очень похожими длинными словами оказываются значительными. Для решения этой проблемы вводим норму расстояния WLD. Для этого необходимо разделить результат WLD на максимальную длину строк, при этом заранее наложив ограничение на весовые коэффициенты, но они не должны превосходить единицы. Таким образом, для невзвешенного нормированного расстояния справедливым становится утверждение, что если LD(A, В) = 0,5, то строка А наполовину похожа на строку В, и наоборот. Если после получения нормированного расстояния значение выходит за границы интервала [0, 1] или меньше нуля, тогда полагаем его равным нулю, а в случае больше единицы полагаем его равным единицы.

Существует ещё один существенный недостаток: при перестановке местами слов или частей слов получаются сравнительно большие расстояния. Для морфем слова эта проблема не существенна, но если переставить местами большие части текста, например, обороты в предложении, абзацы или главы книги, то вывод расстояния будет ошибочным. При этом смысл написанного текста может даже не меняться, а расстояние изменяется весьма значительно. Если меняются местами части слова, то это критично для расчета расстояния. Расстояние должно резко увеличиваться, но для набора слов это правило должно работать наоборот. Для решения этой задачи вводим понятие абстрактного уровня предложения. Абстрактным уровнем называется некий набор блоков символов, полученный после разбиения исходного текста по определённому закону.

Данные представлены елиным объектом

Уровень элементарных объектов

Рис. 1. Абстрактные уровни Счёт уровней начинается от уровня элементарных объектов и выше (рис. 1). Для дальнейшей работы требуется определить закон разбиения. На первой стадии вводим в алфавит специальные символы-разделители на каждый абстрактный уровень или всего один символ для всех уровней. В

случае если не используются символы разбиения, строки разбиваются по зависимостям между символами, которые, в свою очередь, могут быть совершенно любыми объектами, если между ними определено отношение равенства. Также разбивать входные данные можно по несколько фиксированных блоков на уровне до тех пор, пока не будет достигнут определённый предел или деление будет невозможным. В случае если на каждый абстрактный уровень вводится свой символ-разделитель, то не требуется дополнительных операций. Если используется всего один символ -разделитель, то текст можно разбивать на несколько фиксированных блоков в месте положения символов-разделителей. Если на уровне не остаётся символов-разделителей, то разбиение продолжается.

В таком представлении (рис. 1) абстрактные уровни не содержат данных, они только указывают уровни, расположенные ниже. При вычислении расстояния получаем расстояние второго абстрактного уровня, начиная от корня, поэтому корень можно опустить при построении дерева и вычислении расстояния. Если расстояние окажется меньше заданного числа, то можно считать, что объекты равны. Под корнем подразумевается представлением данных как единого объекта. Вычислять расстояние можно только между одинаковыми абстрактными уровнями. Если исходные предложения не получается разделить на одинаковое количество абстрактных уровней, то необходимо разделить входные данные на максимально возможное количество уровней. Например, строка А делится на 2 абстрактных уровня, а строка В - на 5. Очевидно, что строку В требуется делить только до второго уровня, так как операция сравнения разных абстрактных уровней не определена. Таким образом, количество элементов в строке В на втором уровне или ниже будет больше, чем у строки А. После деления на абстрактные уровни можно определить для каждого уровня цену перестановки блока. На нижних уровнях эта цена высока, но чем выше абстрактный уровень, тем эта цена становится меньше.

Далее рассмотрим проблемы, связанные с вычислением семантического расстояния. На вход система получает набор текстов. Каждый текст помечен, к какому классу он относится, например, оценка за ответ. Далее происходит попарно сравнение текстов из этого набора. Если возникает некоторое несоответствие между классами и расстоянием, то необходимо вносить корректировки в функцию оценки. Этих функций 4, для каждой операции по одной. В [3] автор рекомендует использовать элементы теории информации для вычисления веса слова. Если слово встречается в тексте очень часто, то оно является «важным», и наоборот. Этот подход обладает основным недостатком - предлоги и союзы в тексте встречаются гораздо чаще, чем «важные» слова, например, в произведении «Война и мир» самым часто встречающимся словом является предлог «и», который встречается ~22000 раз, следом за ним предлог «в» - ~11000 раз. Хотя смысла в тексте, возможно, они не несут. Этот недостаток решается путём

анализа разницы текстов. Исходя из оценки и расстояния между ними, необходимо сформировать некие правила. Оценка прямого преобразования хранится в виде: x(A)y => x(B)y, class = any, cost = S, так как хранение в обычном виде может повлечь за собой коллизии в оценке расстояния. Эта запись говорит, что преобразование сегмента A в B в контексте x и y относится к классу any и имеет цену S. Разделение на классы требуется для того, чтобы разделять специализированное обучение системы, а именно, обучать систему оценивать ответ на конкретный вопрос от общих знаний системы.

Рассмотрим влияние одних блоков абстрактных уровней на другие. Например, отрицание какого-либо слова или факта с помощью частицы «не». В таком случае будет применено правило коррекции цены существования частицы или ее отсутствия. Но бывают ситуации, когда можно это легко вычислить при наличии незначительного шума. Допустим, имеется 2 почти одинаковых предложения, но в одном отрицается важный факт, а в другом - нет. Посчитав разницу между предложениями, применим различные правила. Правило «отрицание последующего слова» гласит, что частица (блок) не имеет веса и отрицает последующее слово, т.е. вес следующего слова становится отрицательным. Если после повторного пересчёта расстояния это правило пододвинет ближе всего к истинной оценке, то будем считать его правильным и занесём в базу. Если этой корректировки недостаточно, то поднимаемся на один абстрактный уровень выше и пытаемся найти, что ещё можно подкорректировать. Если в тексте встречается несколько одинаковых элементов, например, несколько предлогов «и», то при поиске подходящего правила для его обработки правила применяются ко всем предлогам.

Проблема анализа текстовой информации изначально была связана с выявлением в его тематико-содержательной природе собственно структуры, содержания, правил построения и языковых особенностей. Был рассмотрен метод анализа текстовой информации с помощью нейронной сети, который можно использовать не только в сфере образования, но и в других областях. И, очевидно, что использование нейронных сетей позволяет осуществлять автоматизированный, интеллектуальный контроль знаний тестируемого.

Использованные источники:

1. Григорьев А. П. О применении нейронных сетей в тестировании знаний / А. П. Григорьев, В. Я. Мамаев, 2016

2. Зайцева Л.В. Модели и методы адаптации к учащимся в системах компьютерного обучения // Educational Technology & Society. 2003. Т. 6, №3. С. 204-212.

3. Кохонен Т. Самоорганизующиеся карты / пер. 3-го англ. изд. - М.: БИНОМ. Лаборатория знаний, 2011. - 655 с

4. Мицель А.А. Методы тестирования знаний на основе применения аппарата нейронной сети / А.А. Мицель, А.А. Погуда, К.А. Семенов, А.Е.

Утешева, 2013

УДК 004.65

Останкова Л. М. студент 1 курса

факультет «Информационные системы и технологии» ФГБОУ ВО Поволжский государственный университет

телекоммуникаций и информатики

России, г. Самара БАЗА ДАННЫХ И СИСТЕМЫ УПРАВЛЕНИЯ БАЗАМИ ДАННЫХ

Аннотация: данная статья посвящена системе управления базами данных. Изучены их понятия и содержания. Рассмотрены достоинства и недостатки реляционной модели. База данных является, актуальной и эффективно используется в любой точке мира.

Ключевые слова: база данных, система управления базами данных, модель, ключ, информация, данные.

Ostankova L.M. student

1 course, Faculty of Information Systems and Technologies FGBOU VO Povolzhsky State University of Telecommunications and

Informatics Russia, Samara DATABASE AND DATA BASE CONTROL SYSTEM

Abstract: This article is devoted to the database management system. Their concepts and content are studied. The advantages and disadvantages of the relational model are considered. The database is up-to-date and efficiently used anywhere in the world.

Key words: database, database management system, model, key, information, data.

База данных - это информационная модель, позволяющая упорядоченно хранить данные о группе объектов, обладающих одинаковым набором свойств.

Система управления базами данных - комплекс программных и языковых средств, для необходимой работы с базой данных. Программное обеспечение, предназначенное для работы с базами данных, называется система управления базами данных (СУБД). Используются для упорядоченного хранения и обработки больших объемов информации.

По способу доступа к БД, системы управления ими подразделяются на три типа:

В файл-серверных СУБД файлы данных располагаются централизованно на файл-сервере. Они применяются для обучения в работе с базами данных (используется Microsoft Access) или для хранения

МЕТОД ИСПОЛЬЗОВАНИЯ НЕЙРОСЕТИ КОХОНЕНА ДЛЯ ТЕСТИРОВАНИЯ КАЧЕСТВА ЗНАНИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Нуйкин М.В.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Нуйкин М.В.

Текст научной работы на тему «МЕТОД ИСПОЛЬЗОВАНИЯ НЕЙРОСЕТИ КОХОНЕНА ДЛЯ ТЕСТИРОВАНИЯ КАЧЕСТВА ЗНАНИЙ»