Технология кластеризации на базе искусственных нейронных сетей для оптимизации информационной базы тестов

Костикова М.В.; Скрипина И.В.

УДК 004.942 DOI: 10.30977/BUL.2219-5548.2018.83.0.78

ТЕХНОЛОГИЯ КЛАСТЕРВАЦП НА БАЗ1 ШТУЧНИХ НЕЙРОННИХ МЕРЕЖ ДЛЯ ОПТИМ1ЗАЩ1 1НФОРМАЦШНО1 БАЗИ ТЕСТ1В

Кост1кова М. В., С крипта I. В.,

ХНАДУ

Анотаця. З метою оптим^зацИ формування тестових завдань подано можливу формал1-защю даних, технолог1ю кластеризацИ на баз1 штучних нейронних мереж. Визначено задач1, як виникають при створенш бази даних тестових завдань. Запропоновано процедуру навчання нейронног мереж1 з використанням пакета математичного моделювання МайаЬ.

Ключов1 слова: Moodle, тформацтна база тест1в, самоорганизация, оптим1зац1я, фактор, нейронна мережа, кластеризация, мережа Кохонена.

Вступ

Сучасш шформацшш технологи надають велик можливосп одержувати освггш послу-ги, коли людина знаходиться вдома, в офга та навпъ на вулищ. Застосування цих техно-логш прибирае межi мiж дистанцшним на-вчанням i безпосередньо всередиш навчаль-ного закладу.

На сьогоднi у бшьшосп унiверситетiв плiч-о-плiч iз заочною формою навчання ю-нують дистанцiйнi курси навчання з рiзних дисциплiн за спещальностями вищих навча-льних закладiв.

На кафедрi iнформатики i прикладно! математики ХНАДУ сконструйовано лшшку курсiв з вивчення таких дисциплш як «Комп'ютерна технiка та програмування», «Сучасш iнформацiйнi та комп'ютернi технологи», «1нформатика», «1нформацшш сис-теми i технологи на транспортi». Як платформа в цих курсах була використана система Moodle. Ця система орiентована передусiм на органiзацiю взаемоди мiж педагогом та членами академiчноl групи, хоча вона е придат-ною i для оргашзаци звичних дистанцшних курсiв, а також шдтримки очного навчання. Вже декiлька роюв ця система успiшно вико-ристовуеться тд час навчання студента-заочниюв нашого унiверситету. З другого боку, елементи цих курив активно викорис-товують i студенти денно! форми навчання.

Система Moodle дозволяе розробляти еле-ктронш навчальнi курси, проводити аудито-рне навчання та навчання на вщсташ. Вказа-ний програмний продукт створений вiдповiдно до стандарта шформацшних освiтнiх систем. Вш вiдповiдае таким характеристикам як штероперацшшсть, багатора-зове використання, адаптившсть, довговiч-нiсть, доступнiсть, економiчна ефектившсть.

Викладачi можуть застосовувати Moodle для створення дистанцшних курив, завантажен-ня файлiв i виготовлення урокiв, ведення чата та форумiв, проведення тестувань та юпи-тiв, швидко! i зручно! змiни навчальних матерiалiв; також вказана система дозволяе встановлювати термiн виконання завдань та багато шшого. На нашiй кафедрi викладачi вже не перший рiк використовують цю систему в навчальному процес й весь цей час шукають шляхiв покращення його проведення, у тому чи^ тд час проведення тесту-вання з метою ощнки отриманих студентами теоретичних знань та практичних навичок роботи на персональному комп'ютер^

Обговоримо такий елемент дистанцшного навчання як перевiрка i контроль знань студента. Одним з найважливiших i не-вiд'емних компонентiв навчання е контро-лювання якостi, оцiнювання знань та умшь, отриманих студентами. Система тестування дозволяе виявляти рiвень i якiсть засвоення в системi дистанцшного навчання. Розроблена система тестування використовуеться i для контролю, i для навчання студенев. Голов-ними И складовими е бази тестових завдань та респондента з результатами тестування i статистикою.

Потрiбно врахувати, що дослiдження стану контролю знань студента iз застосуван-ням тестових вимiрникiв виявило певнi про-блеми при використанш тестiв: недостатня яюсть i валiднiсть змiсту тестових завдань, ненадшнють результатiв тестування, недоль ки обробки результата за класичною теорiею теста, вщсутнють використання сучасно! теори обробки тестових матерiалiв iз засто-суванням обчислювально! технiки. Висока похибка вимiрювання тестових результатiв

не дозволяе говорити про високу надшнють результатiв вимiрювання.

Можливостi системи Moodle для прове-дення тестування таю: у закритш формi (множинний вибiр); на встановлення вщповь дносп; на встановлення вiрноl послiдовностi; вiрно / невiрно - питання альтернативного типу (так / ш); коротка вщповщь; числовий; вбудована вiдповiдь (закритий); есе - питання вщкритого типу, що вимагае розгорнуто! вщповщк огляду, твору, звiту (таке питання ощнюеться викладачем); опис; обчислюва-ний.

При використанш ще! системи доходимо висновку: значна частка тестових завдань -це завдання закритого типу, для яких е ймо-вiрнiсть вгадування правильних вiдповiдей. У найбшьш типових випадках, коли студенти повинш вибрати один правильний варiант iз тридцяти п'яти запропонованих, ця ймовiр-нiсть варiюе вiд 25 % до 35 %. Навпъ питання на вщповщнють допускають до 20 % мо-жливосп вгадування вiдповiдей.

Отже створюеться необхщнють врахову-вати це як тд час визначення тдсумково! оцiнки, так i у процесi оцiнювання психомет-ричних показникiв окремих завдань.

Щц час проведення тестування студентiв ми зггкнулися з тим, що частина з них робить вибiр з ушх наявних варiантiв, а частина вщ-кидае варiанти, якi вважае неприйнятними, i робить вибiр з варiантiв, що залишилися. Оцiнювання усшшносп виконання кожного завдання потребуе аналiзу статистики розпо-дiлу вибору варiантiв вiдповiдей. Такi данi можна одержати, якщо у статистицi тесту вибрати шформащю щодо конкретного завдання. В^м для аналiзу потрiбнi чималi ви-бiрки результатiв, отриманих в однакових умовах, що не завжди можливо тд час проведення тестування в Moodle.

У нашш системi ми вирiшили вилучити з бази тести вiрно / невiрно, тести в закритiй формi (множинний вибiр), тести на вщповщ-нють.

Тестування ускладнюеться також можли-вiстю простого заучування вiрних вщповь дей. Досвiд засвiдчив, що студент здатний завчити правильш вiдповiдi на 30-40 питань, при цьому не вдумуючись в !х смислову ощнку.

На перших стадiях розробки шформацш-но! бази тестiв ми (щоб виключити вгадування i заучування) збшьшували кiлькiсть тес-тiв, що невщворотно збiльшило стомлю-

ванiсть студенев i не привело до бажаного результату.

Для виршення цих проблем стали вико-ристовувати можливiсть системи створення питань випадкового вибору одного з декшь-кох аналопчних вiдповiдей.

Для вдосконалення системи тестування застосовуються генератори тестових даних. У випадку автоматично! генераци тестiв за-безпечуеться унiкальнiсть будь-якого отри-маного тесту.

У свою чергу перед нами постало завдан-ня оптимiзацil шформацшно! бази. Набори теспв, створенi в автоматичному режимi з використанням випадкових питань i вщповь дей, виявилися неоднаковими за складнютю. 1х використання суттево впливало на прави-льнiсть ощнювання якостi знань студентiв. За однаково! кiлькостi тестових завдань складнiсть набору теспв виявлялася рiзною.

Аналiз публжацш

Для управлiння складнiстю треба визна-чити функцiю залежностi складностi тестових завдань вщ вхiдних характеристик цих завдань.

Ми зггкнулися iз проблемою, що оптимь зацiя побудови аналпично! залежностi тра-дицiйними методами не можлива. В наш час виршуеться задача самооргашзацп шформацшно! бази з використанням нейромереже-вих технологш [1].

У матерiалах [2] подано найважливiшi ро-здiли теорп штучних нейронних мереж. У книзi даеться детальний огляд i опис найва-жливiших методiв навчання мереж рiзно! структури.

У джерелi [3] розглянуто основш типи нейронiв, архiтектор алгоршмв навчання штучних нейронних мереж. Особлива увага придшяеться задачам обробки шформацп в реальному часi. Поряд iз традицiйними, книга мiстить оригшальш результати, пов'язанi з оптимiзацiею процешв навчання.

Iнформацiйна база тестових завдань скла-дае вектор полiв Х = (Х1,X2,...,Хп). Цi фак-тори впливають на складнiсть теспв. Пiсля вiдповiдних перетворень i зведення шформацп в яюсну форму (так для тесту в закритш формi присвоюемо коефiцiент 1, тест на вщ-повiднiсть - 2, тест iз вбудованою вщповщ-дю - 3, тест який обчислюеться - 4 , коротка вщповщь - 5 i так дал^.

Пiсля виконання тако! формалiзацil буде створено максимiзовану ентропiю закодова-них тестових завдань. Найбшьшу ентропiю

серед статистичних функцш розподiлу мае рiвномiрний розподiл. Отже, пiсля норму-вання тестовi завдання рiвномiрно заповню-ють одиничнi iнтервали. При модифшацп всi фактори мають однакове шформацшне нава-

нтаження. До вектора X ще треба додати час, який буде головним фактором при вста-новленнi тенденцш i прогнозування.

Першу модель щентифшаци залежностi складностi тестового завдання, що е вихщ-ною характеристикою вхщних факторiв, формально можна поти як визначення функцп

В = F X X2, ..., Хп).

(1)

Такi задачi розв'язуються методом най-менших квадратiв; задачi самооргашзацп моделей iз типовим представником розв'язуються методом групового врахування аргумента, трендовим аналiзом та апрокси-мацiею рядами Фур'е.

Друга модель визначення коефщенпв чут-ливосп тестових завдань до змiни значення вхщних факторiв, iншими словами, визначення

дБ , скХк —

с, =-, dk = —к , к = 1, п ,

к дХ/ к Б,

(2)

к

де с к - абсолютний коефщент чутливостi; dk - вщносний коефiцiент чутливостi; Хк , Бк - середнi значення к -го фактора вихщ-но! характеристики вщповщно в певному класi теспв.

Третя модель будуеться при прогнозуван-нi складностi бази тестових завдань за И змь ни з часом. Вона залежить вщ значень вхщних факторiв та !х композици

Б = G(Хг, t), Б = G(X,- , Х2 , ..., Хк , t), (3)

де X, = (Xц , X,2, ..., Xк , t) - , -й вектор фак-

торiв. Необхщно визначити динамiку впливу цього фактора на Б .

Значна кшьюсть вхiдних факторiв, наяв-нiсть додаткових умов у початкових даних, значна наявнють нетривiальних залежностей мiж вихщною характеристикою i композицi-ею вхщних факторiв, необхiднiсть поперед-ньо! обробки початкових даних - все це е особливостями моделей (1)-(3).

Побудова моделей (1)-(3) i пошук необ-хiдних результатiв при !х реалiзацil е потрiб-

ними для розробки шформацшно-аналь тичного забезпечення бази тестових завдань.

На точнють реалiзацil моделей (1)-(3) впливае iнформативнiсть тестових завдань, яю мiстяться в базi. Складнють тестiв залежить як вщ об'ективних, так i вiд суб'ек-тивних ситуацiй. Вони визначаються муль-тиколiнеарними факторами. Наявнiсть велико! кшькосп тестових завдань, рiзнома-нiтнi типи потребують зменшення множини вхiдних факторiв. Для цього необхiдно ви-явити найменш значущi i зробити вилучення. Здiйснити це традицiйними методами без побудови аналгтично! залежностi дуже важ-ко. Якщо функцiю одержано, але компози-цiйна складнiсть залежностi не дозволить отримати вiрний результат.

Мета i постановка завдання

Використання нових шформацшних тех-нологiй стирае гранищ мiж дистанцiйним навчанням i освггою безпосередньо в школi. Контроль якосп, оцiнка знань i навичок, що здобуваються студентами, е одним з найваж-ливших i невiд'емних компонентiв освгш. Система тестування дозволяе визначити рь вень i якiсть навчання в системi дистанцiйно-го навчання. Генератори тестових завдань використовуються для полшшення системи керування.

Метою дослщження е удосконалення ш-формацiйно! базi тестових завдань.

Об'ект дослщження - база даних тестових завдань. Предмет дослщження - тестовi завдання.

Основний матерiал дослщжень

Активна штегращя Укра!ни до европейсь-ко! спiльноти в наш час ставить перед вищою школою новi завдання. Актуальнють тестування знань студенев (отримання освiтнiх послуг без учасп викладача, за допомогою сучасних iнформацiйно-освiтнiх технологiй i систем телекомушкаци) визначаеться тим, що традицшш методи i форми навчання сьо-годнi вже не можуть повнютю задовольнити потребу в послугах навчання для вшх катего-рiй населення.

Провщш науковцi вважають, що за допо-могою штучних нейронних мереж можна розв'язувати майже вш задачг Проблема полягае у правильнiй !х формалiзацi!, визна-ченнi необхiдно! потужносп множини початкових даних i виборi архiтектури та прин-цитв функцiонування мереж, оскiльки !! кшьюсть становить декiлька тисяч. Задачi

кластеризацп та класифшацп з устхом вирь шують нейроннi мережi.

База даних тестових завдань е тим об'ектом дослщження, для якого основними процедурами е впорядкування, систематиза-щя та класифшащя. Значна кшьюсть об'ективних факторiв, якi впливають на ефе-ктивнiсть И використання, створюють перепони до аналiзу та прогнозування тенденцш уие! бази даних тестових завдань.

Самооргашзащю шформацшно! бази тестових завдань здшснимо з використанням нейромережевих технологш [2, 3], яю дозво-ляють полегшити викладачу процес прий-няття важливих i неочевидних рiшень в умо-вах невизначеносп, дефiциту часу i обмежених шформацшних ресурсiв. Ней-роннi мережi дозволять побудувати якiсну iнформацiйну систему для оцшки знань сту-денпв.

Необхiдно розв'язати задачу кластеризации яка полягае у визначеннi груп (кластерiв) векторiв входу, якi мають певш спiльнi влас-тивостi. Вхщш фактори i вихiднi характеристики належать до векторiв входу.

До одного i того ж кластеру належать об-рази, вiдстань мiж якими е менше за деяке додатне число. Образи подiбного кластера належать гшерсферт Значення дрiбних фак-торiв можуть виходити за межi гiперсфери по однiй чи декшькох осях, тому що вони не впливатимуть на належнють образу до класу. Визначення цих факторiв та !х вилучення з шформацшно! бази дозволить зменшити ная-внiсть шумових ефектiв, скоротити час на-

вчання нейронно! мережi, а також збшьшити точшсть щентифшацп.

Для кластеризацп використаемо самоор-ганiзуючу мережу, вона називаеться мережею Кохонена. Мережа реалiзуе принцип навчання без вчителя, i результатом li функ-цiонування буде формування клаив та вщне-сення до них дослщних образiв. В OTCT^i моделювання Matlab алгоритм навчання мае такий вигляд

net=newe(pr,s,klr), net.trainParam.epoch s = 1000 net=train(net,P), a =sim(netP) ac=vec2ind (a).

Мережа Кохонена е одношаровою. Така мережа створюеться пiсля виконання функцп newe(pr, s, klr), де pr - матриця мшмаль-них i максимальних елеменпв векторiв входу, s - кiлькiсть кластерiв (нейронiв), klr -коефiцiент навчання. Функщя train(net,P) здiйснюе навчання мережа Визначимо таб-лицю початкових даних як P, а кшьюсть циктв навчання установимо 1000.

Функцп a = sim(netP), ac = vec2ind(a) виконують моделювання роботи мережi тс-ля навчання. Елементи вектора ac мютять номери класiв вхщних образiв.

На рис. 1 показаш архiтектура системи i функцп, що використовуються при побудовi мережi Кохонена.

Р{1>

Celay-s 1

ЬМ>

Рис. 1. Архитектура i функцп мережi Кохонена

Щоб навчити мережу Кохонена, необхщ-но певним чином розташувати ваговi коефь цiенти. Слiд використовувати функцп: negdist - обчислення вщ'емно! евклщово! вiдстанi вагових коефiцiентiв вщ вхiдного образу z = -sqrt(sum(w - х))2; netsum - обчислення активаци; compet - визначення головного нейрона.

Допустимо, що кiлькiсть вхщних образiв являе m, а кшьюсть кластерiв - вiдповiдно

k . В результатi моделювання отримаемо вектор Q = (01, 42, .., 4m ^ де q g{1, 2 k}

i = 1, m - номер кластера i -го вхщного образу.

Зрозумiло, що кiлькiсть кластерiв мусить бути бiльшою чи рiвною 2. У задачi вона так само не перевищуватиме кiлькостi вхщних факторiв n +1. Якщо фактор е неважливим, то, незалежно вщ кiлькостi кластерiв, вiн не буде здшснювати вплив на належнють образу до певного кластеру.

Для того, щоб перевiрити вартють факто-рiв Xь X2, ..., Xn, треба виконати алгоритм, наведений вище для первинних образiв p за рiзноманiтних значень 5 . Кожному iз розглянутих образiв буде визначено у вщпо-вiднiсть число - номер класу, шакше кажучи, зроблено вщображення Р, ^ К/, , = 1, т,

j = 2, n +1, де i - це номер образу, а j - кь льюсть кластерiв.

Наалi вiднаходимо кореляцiйну матрицю

R BeKTopiB Х1, X2, ..., Xn, K2, K3, ..., Kn+1 .

Для нового аналiзу матрицi R = (rj) будуть потрiбнi елементи rу , i > n +1, j < n + 1.

Абсолютш значення за стовпчиками зна-

2n+1

ij /i J

n+1 ,

ходяться як

: Si =£ \rj , j = 1, n +1.

i=1

Для створення вектора значущих факторiв викладач, який приймае рiшення, повинен задати певне додатне число

i \

C е

min S , max S

i виключити всi фак-

тори, вщповщш значення яких Sj < C .

Втрачена точнють у результат виконання тако! процедури покриеться зростанням швидкост навчання нашо! нейронно! мережi та скороченням наявностi шумових ефекпв. Коли визначаеться вектор важливих вхщних факторiв, тодi й закiнчуеться перший етап самооргашзацп бази даних БТЗ (бази даних тестових завдань).

Черговий етап пошуку полягае у визна-ченш тих образiв, якi потрiбнi для розгляду та аналiзу. Беручи до уваги те, що база тестових завдань мютить значну кшьюсть записiв, притому, незважаючи на вилучення незнач-них факторiв, кшькють факторiв, що зали-шились, становить кшька десяткiв, пошук необхщно! шформацп триватиме доволi дов-гий час. Також важливим е розв'язання зада-чi про те, чи належить нове завдання до класу, що щкавить викладача. Припустимо, що вс ТЗ (тестовi завдання), шформащя про якi мiститься в базi даних, належать до двох клаав.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Запропонуемо таку процедуру класифша-ци та визначення потрiбних тестових завдань з уше! генерально! сукупностi даних по ТЗ -випадковим чином визначимо популящю завдань. Якщо тестове завдання вщноситься до теми модуля, то вщносимо його до пер-

шого класу, iнакше - до другого. Зазначимо, що надана популящя мусить бути репрезентативною. Без цього точнють класифшацп може бути низькою. Користуючись такою класифiкацiею та шформащею про класи, виконаемо процедуру навчання нейронно! мережi в Matlab:

net=newlvq(pr,sl,lr),

P = [ P1 P2 - Pn ] ,

Tc =[2 1 ... 2],

net.trainParam.epochs = 2000,

net=trainParam.lr=0.05,

net=train (net,P,Tc).

Функщя newlvq створюе мережу для кла-сифiкацi! вхщних векторiв. Найчастiше така мережа проводить кластеризащю i класифь кацiю векторiв входу та е розвитком самоор-ганiзуючих мереж Кохонена [2].

Навчання мережi виконуеться за допомо-гою функцi! train. Мережа мае лшшш та кон-куруючi шари. Пiсля навчання мережi пере-вiряемо, чи правильно вона виконуе класифшащю. Задаемо такi команди:

Y = sim (net,P) ,

Yc = vec2ind (Y) .

Пiсля виконання команд отримуемо вектор Yc, що збтаеться з вектором Tc. Пюля тако! перевiрки мережу можна використати. Визначаемо належнють тестового завдання вщповщному класу. Для цього виконуемо послщовнють команд:

P1 = [p1]

Y1 = sim(net, P1),

Y 1c = vec2ind(Y1),

де P1 - контрольний образ.

Зважаючи, що на вхщ нейронно! мережi без перерви можна дати значення вшх факто-рiв, що мiстять iнформацiю про вс розмiщенi в базi даних ТЗ, можна одержати !! значення виходу, як вказуватимуть на приналежнють тестового завдання до потрiбного класу. Таким чином, задача класифшацп буде розв'язана.

При виборi тестового завдання викладач звертае увагу на значення певних теспв з великою оцшкою, як вiн вважае головними.

Деяю фактори найчастiше лишаються поза його увагою. Так, при формуванш множини припустимих варiантiв ТЗ найчаспше викла-дач орiентуеться на значення шдексних вхщ-них факторiв. Вибiр об'екта iз ще! множини здшснюеться за оптимальною композицiею iнших факторiв. Запропонований нами метод дозволяе оптимзувати цю процедуру за часом.

Застосування цього методу в реальних задачах е можливим при впровадженш спеща-льно! штегровано! автоматизовано! системи ^1АС). Вона орiентована на базу даних з ро-зробленими алгоритмами функцюнування вказаних мереж.

Висновки

Розглянута технолопя кластеризацн на базi нейромережевих технологи е варiантом оптимiзацi! великих баз даних. Головне, що нейронна мережа без втручання викладача з'ясовуе, яку шформащю можна вилучити без збшьшення ентропи, якi фактори е дру-горядними при визначеннi складностi набору тестових завдань. При И використанш значно скорочуеться кшьюсть розрахункiв при ви-значеннi записiв бази тестових завдань, як вiдповiдають вимогам викладача.

Для цього необхщно перевiрити ус записи на вiдповiднiсть кожного поля певному критерда. За новою технолопею достатньо навчити нейронну мережу класифшувати тестовi завдання, а тсля цього лише викори-стати И у прямому режимi функцiонування для визначення належносп певним класам тестових завдань, що мютяться у базi даних.

Впровадження запропоновано! технологи ефективно вплине на тдвищення якостi ощ-нки знань студентiв.

Лггература

1. Костикова М. В. Анализ эффективности тести-

рования при дистанционном обучении / М. В. Костикова, И. В. Скрипина // Дистан-цшна освгга у ВНЗ: шновацшш та психолого-педагопчш аспекти: зб1рник наукових праць за матер1алами М1жнародно! науково-методично! конференцп, м. Харк1в, 19-20 листопада 2015 р. - Харшв: Мськдрук, 2015. -С. 126-128.

2. Осовский С. Нейронные сети для обработки

информации / С. Осовский. - М.: Финансы и статистика, 2002. - 344 с.

3. Бодянский Е. В. Искусственные нейронные

сети: архитектуры, обучение, применения / Е. В. Бодянский, О. Г. Руденко. - Харьков: Те-летех, 2004. - 369 с.

References

1. Kostikova M. V. Analiz effektivnosti testirovaniya

pri distantsionnom obuchenii [Analysis of efficacy testing at a distance education] / M. V. Kostikova, I. V. Skripina // Dystantcijna osvita u VNZ: Innovatsijni ta psyhologo-pedagogichni aspekty: zbirnyk naukovih pracz za materialamy Mizhnarodnoyi naukovo-metodychnoyi konferenciyi, m. Xarkiv, 19 - 20 lystopada 2015 r. - Xarkiv: Miskdruk, 2015. -S. 126 - 128.

2. Osovskiy S. Neyronnyie seti dlya obrabotki

informatsii [Neural networks for information processing] /S. Osovskiy. - M.: Finansyi i statistika, 2002. - 344 s.

3. Bodyanskiy E. V. Iskusstvennyie neyronnyie seti:

arhitekturyi, obuchenie, primeneniya. [ Artificial neural networks: architecture, training, applications] / E. V. Bodyanskiy, O. G. Rudenko. - Harkov: Teleteh, 2004. - 369 s.

Костикова Марина Володимирiвна, канд. техн. наук, доцент, кафедра шформатики i прикладно! математики,

Харкiвський нацюнальний автомобiльно-дорожнiй унiверситет, вул. Ярослава Мудрого, 25, Харюв, 61002, Украша, телефон +380577073774, kmv [email protected]

Скришна 1рина Валентинiвна, старший викладач, кафедра шформатики i прикладно! математики,

Харювський нацiональний автомобiльно-дорожнiй унiверситет, вул. Ярослава Мудрого, 25, Харюв, 61002, Украша, телефон +380577073774, [email protected]

Technology of clusterization on the basis of artificial neural networks for optimization of the information basis of tests

Kostikova М. V., Skrypina I. V.

Abstract. The use of new information technologies blurs the boundaries between distance learning and education directly within the school. One of the most important and integral components of education is the quality control, assessment of knowledge and skills acquired by students. The testing system allows determining the level and quality of learning in a distance learning system. Test task generators are used to improve the control system. Goal. To control the complexity of a set of tests, it is necessary to determine the function of dependence of the complexity of test tasks on the input characteristics of these tasks. Optimization of the construction of analytical dependence by traditional methods is impossible. It is necessary to

solve the problem of self-organization of the information base using neural network technologies. This will allow developing information and analytical support for the database of test tasks. Methodology. The object of the study is a database of tests. The main procedures are streamlining, systematization and classification. A significant number of objective factors affecting the efficiency of its use, create obstacles to the analysis and prediction of trends in the entire database of test items. Kohonen self-organizing network was used for clustering. It implements the principle of learning without a teacher and the result of its functioning is the formation of classes and the assignment of research images to them. The algorithm for creating, learning and modeling is implemented in Matlab. Kohonen's network training consists in setting up weights in a certain way. Results. The proposed method allows to optimize the procedure for creating and classifying test tasks over time. It is used clustering based on neural network technology. Originality. The advantage of the proposed algorithm is that the neural network without the participation of the teacher determines what information can be extracted without increasing entropy and which factors are secondary in determining the complexity of the test. The number of calculations is significantly reduced. Practical value.

Using the obtained base of test items will improve the quality of student learning and more objectively assess the knowledge gained in the learning process. It will facilitate the work of the teacher in preparing the examination tasks.

Key words: Moodle, test database, self-organization, optimization, factor, neural network, clustering, Kohonen network.

Технология кластеризации на базе искусственных нейронных сетей для оптимизации информационной базы тестов

Костикова М. В., Скрипина И. В.

Аннотация. С целью оптимизации формирования тестовых заданий представлена возможная формализация данных, технология кластеризации на базе искусственных нейронных сетей. Определены задачи для решения при разработке информационно-аналитического обеспечения процессов в базе данных. Предложена процедура обучения нейронной сети с использованием пакета математического моделирования Matlab.

Ключевые слова: Moodle, информационная база тестов, самоорганизация, оптимизация, фактор, нейронная сеть, кластеризация, сеть Кохонена.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Костикова М. В., Скрипина И. В.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Костикова М. В., Скрипина И. В.

TECHNOLOGY OF CLUSTERIZATION ON THE BASIS OF ARTIFICIAL NEURAL NETWORKS FOR OPTIMIZATION OF THE INFORMATION BASIS OF TESTS

Текст научной работы на тему «Технология кластеризации на базе искусственных нейронных сетей для оптимизации информационной базы тестов»