Научная статья на тему 'Data Mining и статистические методы при оценивании качества курсов повышения квалификации'

Data Mining и статистические методы при оценивании качества курсов повышения квалификации Текст научной статьи по специальности «Науки о здоровье»

CC BY
327
47
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Открытое образование
ВАК
Область наук
Ключевые слова
КУРСЫ ПОВЫШЕНИЯ КВАЛИФИКАЦИИ / СТАТИСТИКА / DATA MINING / R LANGUAGE / KNIME / PROFESSIONAL DEVELOPMENT COURSES / STATISTICS

Аннотация научной статьи по наукам о здоровье, автор научной работы — Гальченко Максим Иванович, Гущинский Александр Геннадьевич

В статье рассматриваются кейс анализа данных, c использованием специализированного ПО, связанных с образовательной статистикой, а именно результатом опроса слушателей курсов повышения квалификации. Показывается необходимость расширенной статистической обработки результатов, схема проведения анализа. Показаны выводы по исследуемому кейсу.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам о здоровье , автор научной работы — Гальченко Максим Иванович, Гущинский Александр Геннадьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DATA MINING AND STATISTICS METHODS USAGE FOR ADVANCED TRAINING COURSES QUALITY MEASUREMENT: CASE STUDY

In the article we consider a case of the analysis of the data connected with educational statistics, namely result of professional development courses students survey with specialized software usage. Need for expanded statistical results processing, the scheme of carrying out the analysis is shown. Conclusions on a studied case are presented.

Текст научной работы на тему «Data Mining и статистические методы при оценивании качества курсов повышения квалификации»

УДК 00467 М.И. Гальченко, А.Г. Гущинский

ВАК 05.13.16 ' 3 ^

РИНЦ 83.77.31

Data Mining и статистические методы при оценивании качества курсов повышения квалификации

В статье рассматриваются кейс анализа данных, c использованием специализированного ПО, связанных с образовательной статистикой, а именно - результатом опроса слушателей курсов повышения квалификации. Показывается необходимость расширенной статистической обработки результатов, схема проведения анализа. Показаны выводы по исследуемому кейсу.

Ключевые слова: курсы повышения квалификации, статистика, Data Mining, R Language, KNIME.

DATA MINING AND STATISTICS METHODS USAGE FOR ADVANCED TRAINING COURSES QUALITY MEASUREMENT: CASE STUDY

In the article we consider a case of the analysis of the data connected with educational statistics, namely - result of professional development courses students survey with specialized software usage. Need for expanded statistical results processing, the scheme of carrying out the analysis is shown. Conclusions on a studied case are presented.

Keywords: professional development courses, statistics, Data Mining, R Language, KNIME.

1. Введение. Постановка задачи

Оценка любого мероприятия, позволяющего повысить компетентность слушателей, состоит из двух компонент: собственно оценка полученных знаний, умений и навыков и оценка пользователями проведенных мероприятий. Если в случае высших образовательных учреждений, школ оценка подачи материала, самооценка полученных знаний, ведения занятий, качества преподавания зачастую связана с огромной долей субъективизма и по этой причине не может быть признана валидной, то в случае курсов повышения квалификации можно ожидать более ответственного подхода к такого рода оценкам.

По этой причине отдел кадров одной из сетевых компаний проводит мониторинг процесса обучения слушателей с целью получения обратной связи на уровне слушателей и корректировки выявляемых проблем. Сбор информации произво-

дится после недельного обучения на очных курсах повышения квалификации по темам, связанным с обслуживанием электроэнергетического оборудования («Организация ремонтного, оперативного и технического обслуживания оборудования подстанций 35-110 кВ», «Организация ремонтного, оперативного

и технического обслуживания оборудования подстанций 35-110 кВ» и т. д.) путем заполнения слушателями опросного листа.

Для заполнения слушателям предлагались опросные листы, содержащие 15 характеристик, названия которых были кодированы для последующей обработки (табл. 1).

Таблица 1.

Оцениваемые параметры и их кодировка для последующей обработки

Оцениваемый параметр Кодировка

Общая организация процесса обучения obshorg

Оснащение и оборудование учебной аудитории oboryd

Соответствие времени проведения занятий заявленному по расписанию cootvraspis

Соответствие содержания обучения заявленной программе sootvprogr

Практическая полезность проведённого обучения polezn

Доступность изложения материала dostypmat

Использование современных методов подачи материала sovrmetod

Индивидуальный подход к слушателю indpodxod

Эффективность взаимодействия преподавателя с аудиторией vzaimodayd

Получение обратной связи от преподавателей obrcvyazprepod

Получение обратной связи от работников кафедры obrcvyazkaf

Взаимодействие слушателей между собой vzaimodslysh

Наличие, качество, полезность раздаточных материалов razdatmat

Качество питания в столовой pitanie

Общие впечатления о проведенном обучении obsh

Максим Иванович Гальченко,

ст. преподаватель Тел.: (911) 761-67-41 Эл. почта: maxim.galchenko@gmail.com Санкт-Петербургский государственный аграрный университет

Maxim I. Galchenko,

Senior lecturer Tel.: (911) 761-6741 E-mail: maxim.galchenko@gmail.com Saint-Petersburg State Agrarian Univesity

Александр Геннадьевич Гущинский,

руководитель учебного центра ОАО «Ленэнерго» Тел.: (921) 958-76-70 Эл. почта: Guschinskiy.AG@nwenergo.com Ленэнерго, ОАО

Alexander G. Gushchinskij,

Head of the Training Center of"Lenenergo" Tel.: (921) 958-76-70 E-mail: Guschinskiy.AG@nwenergo.com "Lenenergo", JSC

Каждый из показателей оценивался по десятибалльной шкале от 0 (очень плохо) до 10 (отлично). Следует отметить, что последний параметр «Общие впечатления о проведенном обучении» по сути является обобщающим для всех прочих (целевой переменной).

Всего было получено 316 заполненных опросников.

В результате отдел кадров стал обладателем большого массива данных, обработка которого проводилась в Excel и носила весьма общий, описательный характер. Целью нашей работы, которая и описывается в настоящей статье, было выполнение максимально полного анализа данных и фактически построение протокола воспроизводимого исследования.

Задачи, ставившиеся при проведении анализа, были сформулированы отделом кадров следующим образом:

- оценить качество полученных в результате опроса данных;

- выделить основные факторы, влияющие на оценку курса слушателями;

- дать рекомендации касательно улучшения характеристик курсов.

В качестве инструментов нами были выбраны: язык статистического программирования R [1] и платформа для интеллектуального анализа данных KNIME [2].

Ниже мы представим описание самого кейса с целью максимально полно проиллюстрировать причины, по которым были выбраны именно такой набор методов и последовательность шагов.

2. Статистическая обработка данных

Изначально данные подверглись очистке от неполных данных, так как часть применяемых методов не может быть использована в случае наличия пропущенных значений. В результате выборка уменьшилась до 315 записей.

Проверка данных на нормальность с помощью критерия Шапиро - Уилка дала отрицательный результат по всем полям. Пик приходится на значение 10 (отлично) по всем показателям (что уже вызывает вопрос о наличии «мусора» -формально заполненных опросных листов). Так, для показателя «Общие впечатления о проведенном обучении» гистограмма показывает превалирующее в выборке значение 10, при низких частотах ниже 6 (рис. 1), что является характерным для всех остальных полей.

Для оценки связей между переменными была вычислена матрица корреляций Спирмена, впоследствии подвергнутая фильтрации на уровне 0.6, для чего был использован пакет сопр1о1 языка Я [3] (рис. 2).

Рис. 1. Гистограмма распределения оценок по полю «Общие впечатления о проведенном обучении» (обозначения по меткам табл. 1)

f i 3 & t S

5 £ 1 5. 3 -S

I | i I I I

° о

§

a E

. Ш

я -а Я Й

гм 2 J3 О

> о тз

vzaimodslysh

0.610.570.530.610.530.450.47

obrcvyazKaf (J 0.630.710.6в0.5^0.55р.53

sovrmetod

Ш

obrcvyazprepod ( J) ^^ (J) vzaimodayd indpodxod

0.57 0.6 0.620.57 0.6 0.680.670.510.66

lo.s

10.6

0.4 0.2

0.770.640.68

obsh

0.550,67

ээээээ

0.55

0.2 0.4 0.6 0.8

-1

Рис. 2. Матрица корреляций по Спирмену

В указанном случае корреляции значимы на уровне р = 0.05.

Исходя из полученных результатов на полном наборе данных, можно утверждать, что присутствует высокий уровень корреляции между показателями «Индивидуальный подход к слушателю» и «Эффективность взаимодействия преподавателя с аудиторией» и «Получение обратной связи от преподавателей» и «Получение обратной связи от работников кафедры». Таким образом, можно с уверенностью говорить о том, что слу-

шатели практически не разделяют индивидуальный подход и эффективность преподавателя, а также видят в преподавателе представителя кафедры.

Стоит отметить большую долю корреляций в рассматриваемом наборе, значения которых могут быть трактованы как средние (значения от 0.5 до 0.7).

При оценивании процессов часто возникают группы лиц, действующих сходным образом, поэтому следующим вопросом, который решался в рамках поставленной за-

дачи, было получение информации о наличии либо отсутствии таких групп. К тому же результаты первых шагов дают повод к размышлениям о наличии «мусора» - формально заполненных опросных листов.

Для этих целей к выборке была применена процедура кластерного анализа с использованием алгоритма fuzzy C-means с предопределенным количеством кластеров, равным 4. В результате было получено четыре группы, одна из которых составила порядка 40% , остальные группы - от 17 до 20% от мощности исходной выборки (табл. 2).

Для оценки различий между полученными группами были рассчитаны медианы и межквартиль-ный размах по всем показателям (табл. 3).

В целом стоит отметить достаточно высокие оценки по всем параметрам процесса слушателями групп 2-4.

Остановимся на некоторых выводах, которые позволяет сделать имеющаяся информация.

Группа 2 слушателей оценила все параметры на 10, а «Оснащение и оборудование учебной аудитории» и «Качество питания в столовой» в большинстве случаев на 9-10 баллов. Скорее всего, эта группа слушателей подошла формально к заполнению бланков и должна быть исключена из дальнейшего рассмотрения.

Таблица 3

Межквартильный размах и медианы показателей по группам

Группа Межквартильный размах Медиана

1 2 3 4 1 2 3 4

Общая организация процесса обучения 1,0 0,0 2,0 1,0 7,5 10,0 9,0 8,0

Оснащение и оборудование учебной аудитории 3,0 1,0 3,5 2,0 7,0 10,0 8,0 8,0

Соответствие времени проведения занятий заявленному по расписанию 2,0 0,0 0,5 1,0 9,0 10,0 10,0 10,0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Соответствие содержания обучения заявленной программе 1,0 0,0 1,0 2,0 8,0 10,0 10,0 9,0

Практическая полезность проведённого обучения 3,0 0,0 2,5 2,0 7,0 10,0 8,0 8,0

Доступность изложения материала 1,0 0,0 1,0 1,0 8,0 10,0 10,0 8,0

Использование современных методов подачи материала 1,8 0,0 1,0 1,0 7,0 10,0 10,0 8,0

Индивидуальный подход к слушателю 2,0 0,0 1,0 2,0 7,0 10,0 10,0 8,0

Эффективность взаимодействия преподавателя с аудиторией 1,0 0,0 1,0 1,0 8,0 10,0 10,0 9,0

Получение обратной связи от преподавателей 1,0 0,0 0,0 2,0 8,0 10,0 10,0 9,0

Получение обратной связи от работников кафедры 2,0 0,0 0,0 2,0 7,0 10,0 10,0 9,0

Взаимодействие слушателей между собой 1,0 0,0 0,0 2,0 8,0 10,0 10,0 9,0

Наличие, качество, полезность раздаточных материалов 3,0 0,0 3,0 2,0 6,5 10,0 8,0 8,0

Качество питания в столовой 2,8 1,0 2,5 4,0 7,0 10,0 9,0 8,0

Общие впечатления о проведенном обучении 2,0 0,0 2,0 1,5 7,0 10,0 9,0 8,0

Рис. 3. Оценка раздаточных материалов в группах 1-4

12-

12 3 4

du

Рис. 4. Оценки фактора «Качество питания в столовой» в различных группах

т 2 3 1

С1и

Рис. 5. Оценки фактора «Практическая полезность проведённого обучения»

в различных группах.

Группа 1 наиболее критично отнеслась к оценке курсов. Особо стоит отметить низкую оценку по параметру «Наличие, качество, полезность раздаточных материалов» в этой группе (рис. 3). Вообще, если говорить о раздаточных материалах, то различия между группами по данному фактору значимы на уровне 0.05 (Kruskal - Wallis chi-squared = = 20.5337, df = 2, p = 3.477e-05). Построение диаграмм проводилось с помощью пакета ggplot2 языка R [4].

Аналогичная картина наблюдается по параметру «Качество питания в столовой». Различия между группами по данному фактору значимы на уровне 0.05 (Kruskal -Wallis chi-squared = 20.0733, df = 2, p = 4.377e-05), при этом в группе 4 размах очень велик - первая квартиль равна 5 баллам (рис. 4).

Различия по показателю «Практическая полезность проведённого обучения» также статистически значимы на уровне 0.05 (Kruskal-Wallis chi-squared = 38.5622, df = 2, p = 4.23e-09), при этом первая группа оценивает в 25% случаев данный фактор на уровне, меньшем пяти баллов (рис. 5).

Аналогичная картина наблюдается и по параметрам «Оснащение и оборудование учебной аудитории», «Доступность изложения материала» и «Индивидуальный подход к слушателю».

Около трети аудитории находится в группах 1 и 4, в которых и наблюдается относительно низкое оценивание по описанным выше параметрам (оценки всё же редко опускаются ниже 5, т.е. в область полной неудовлетворенности сложившимся положением).

Для выявления скрытых факторов и их относительной важности был использован факторный анализ. Предварительно из рассмотрения была исключена 2-я группа слушателей, как, вероятно, подошедшая формально к заполнению листов.

Фильтрация привела к потере значимой части линейных связей (рис. 6).

Анализ статистически значимых показателей приводит к выводу о том, что слушатели тесно увя-

1

1

1

3

X

I

obrcvyazkaf

obrcvyazpfepod

vzaimodayd

indpodxod

0.59 0.54 0.46

О 0.6 0.6

э » 0.71 i

э О

p.4 3.2

Рис. 6. Корреляция по Спирмену после фильтрации 2-й группы слушателей

Рис. 7. Диаграмма рассеяния для показателей «Индивидуальный подход к слушателю», «Эффективность взаимодействия преподавателя с аудиторией»

Нагрузки параметров

зывают «Индивидуальный подход к слушателю», «Эффективность взаимодействия преподавателя с аудиторией», «Получение обратной связи от преподавателей» (коэффициент корреляции не менее 0.6). Сохраняется средний уровень связи (0.59) между факторами «Получение обратной связи от преподавателей» и «Получение обратной связи от работников кафедры».

Особо выделим сильную связь между параметрами «Индивиду -альный подход к слушателю» и «Эффективность взаимодействия преподавателя с аудиторией». Связь не тривиальна по структуре, что показывает диаграмма рассеяния (рис. 7).

Результаты факторного анализа (пакет psych [5]) позволяют говорить о наличии пяти скрытых факторов (MLE Chi Square = 39.804, p < 0.134) (табл. 4).

Данные пять факторов объясняют порядка 50% вариации выборки, при этом факторы 1 и 2 объясняют по 16% вариации, факторы 4, 5 и 3 - по 8, 5, 4% соответственно.

Графическая интерпретация результатов (рис. 8) дает наглядное представление о структуре факторов.

Первый фактор можно трактовать как «Индивидуальное мастерство преподавателя» (индивидуальное мастерство, эффективное взаимодействие с аудиторией, доступность изложения материала), второй - «Эффективность работы кафедры» (общая организация, современные методы преподавания,

Таблица 4

MR1 MR2 MR4 MR3 MR5

Параметр (Фактор 1) (Фактор 2) (Фактор 4) (Фактор 3) (Фактор 5)

Общая организация процесса обучения -0,003 0,717 0,289 0,228 0,026

Оснащение и оборудование учебной аудитории 0,137 0,501 -0,028 0,002 0,021

Соответствие времени проведения занятий заявленному по расписанию 0,001 0,416 0,175 0,035 0,358

Соответствие содержания обучения заявленной программе 0,332 0,131 0,554 -0,011 0,327

Практическая полезность проведённого обучения 0,228 0,135 0,468 0,050 0,066

Доступность изложения материала 0,571 0,135 0,501 -0,009 -0,048

Использование современных методов подачи материала 0,203 0,693 0,274 -0,135 -0,063

Индивидуальный подход к слушателю 0,786 0,187 0,143 -0,066 -0,029

Эффективность взаимодействия преподавателя с аудиторией 0,761 0,169 0,166 0,147 0,241

Получение обратной связи от преподавателей 0,654 0,192 0,361 0,147 0,136

Получение обратной связи от работников кафедры 0,254 0,596 0,063 0,194 0,273

Взаимодействие слушателей между собой 0,186 0,547 0,042 -0,009 0,301

Наличие, качество, полезность раздаточных материалов 0,068 0,079 0,074 -0,221 0,326

Качество питания в столовой 0,101 0,109 0,059 0,716 -0,096

«Общие впечатления о проведенном обучении» с целью увеличения частот по возможным вариантам ответа: значения от 0 до 6 кодировались значением 1 (Плохо), от 7 до 8-2 (Удовлетворительно), от 9 до 10-3 (Отлично).

Результат следует признать не очень впечатляющим: оценка аккуратности при кросс-валидации методом leave-one-out дала результат в 63% при применении алгоритма Decision Tree (оценка качества -Gain Ratio, минимально количество записей на узел - 10). Оценка F-measure по 20%-й тестовой выборке дала относительно хороший результат для класса «1» (0.8) и удовлетворительный для классов «2» и «3» (0.6 и 0.632 соответственно, что объясняется низкой специфичностью класса «3» - 0.565 и низкой чувствительностью класса «2» - 0.529).

Полученная модель дает общее представление о структуре оценивания слушателями курсов (рис. 9).

Так, большая часть всех слушателей (14 из 20), оценивших от 0 до 4 общие впечатления от курса, пос-

обратная связь, взаимодействие слушателей, оборудование, соответствие расписанию), четвертый - «Полезность обучения» (соответствие программе, полезность). Отдельно идут качество питания и раздаточных материалов.

В соответствии с ранжированием факторов наибольший вес имеет индивидуальное мастерство преподавателя и эффективность работы кафедры. Управление, нацеленное на решение именно этих проблем, даст наибольший эффект. Полезность является также достаточно важным фактором, который требует особого внимания, с учетом полученных ранее результатов.

3. Data Mining

Для оценки возможности прогнозирования общего впечатления от курсов было проведено исследование выборки с помощью различных алгоритмов классификации Data Mining в KNIME.

Предварительно было проведено изменение шкалы по полю

Рис. 8. Графическая интерпретация результатов факторного анализа

Рис. 9. Дерево решений, первые три деления

читали курс бесполезным для себя (оценки ниже 5 баллов).

С другой стороны, полезность, оцененная в 9-10 баллов, при оценках обратной связи с кафедрой в 9-10 баллов, соответствии занятий расписанию в 9-10 баллов, обратной связи с преподавателем в 8-10 баллов дает общую оценку в 9-10 баллов (84%, 36 из 43 слушателей).

Если же при выполнении всех предыдущих условий полезность оценивается в диапазоне от 6 до 8 баллов, то основную роль играют питание и общая организация процесса: питание, оцененное в 8-10 баллов, и общая организация, оцененная в 9-10 баллов, дают результат «Отлично» (73%, 19 из 26 слушателей). Если же питание оценено в 7 баллов и ниже, результат в большинстве случаев - «Удовлетворительно» (78%, 14 из 18 слушателей).

Остальные диапазоны указанных выше факторов дают неустойчивый результат ввиду малых частот.

4. Выводы

На основании проведенного анализа для нашей, конкретной задачи, поставленной отделом кадров, можно сформулировать следующие рекомендации:

- акцентировать внимание слушателей на вдумчивое заполнение опросного листа, так как количество брака существенно и достигает 40% от общего числа. Стоит рассмотреть вопрос об электронной форме тестирования и заполнении дополнительных полей (возраст, стаж, образование и пр.) с анони-мизацией опросника;

- как первоочередные для улучшения показатели можно выделить: «Наличие, качество, полезность раздаточных материалов», «Качество питания в столовой», «Практическая полезность проведённого обучения», «Оснащение и оборудование учебной аудитории», «Доступность изложения материала» и «Индивидуальный подход к слушателю»;

- при найме преподавателей стоит обращать внимание на готовность работать в сетке расписания, максимальную нацеленность на индивидуальную работу, эффек-

тивное взаимодействие со слушателями;

- хорошее питание, общая организация процесса и эффективная обратная связь с кафедрой способны значимо повысить общую удовлетворенность слушателей;

- особенно стоит отметить важность факторов «Качество питания в столовой» и «Общая организация процесса обучения» в тех случаях, когда прямая польза курсов для слушателей не очевидна;

- высокий уровень корреляции между параметрами «Индивиду -альный подход к слушателю» и «Эффективность взаимодействия преподавателя с аудиторией» может говорить о том, что студенты будут тяжело воспринимать элементы дистанционного образования в курсах.

Как видно, использовавшийся набор показателей позволяет достаточно полно оценить удовлетворенность слушателей, выявить узкие места и дать рекомендации по улучшению процесса подготовки слушателей на курсах повышения квалификации.

С точки зрения формирования протокола воспроизводимого исследования мы можем предложить следующую последовательность шагов для обработки подобных данных:

- на первом этапе выполнить очистку данных от неполных записей и выбросов. Очистка производится только тогда, когда соответствующий метод не способен учитывать возможные пропуски в данных. В противном случае очистка данных от неполных записей может быть вредным действием;

- на втором этапе оценить нормальность данных по каждому показателю с целью определения методов статистического исследования (допустимости использования методов параметрической статистики);

- исследовать результат оценивания с помощью кластерного анализа. Этот вид анализа позволяет достаточно эффективно выделить группы пользователей, отвечавших сходным образом. Как показал рассмотренный выше кейс, кластерный анализ позволяет выделить

подозрительные на «мусор» записи (в нашем случае - высший балл по всем параметрам). В нашем случае хорошие результаты дал метод fuzzy C-means с использованием Манхэттенского расстояния. При анализе удобно визуализировать результат кластерного анализа с помощью ящиков с усами с условием (conditional boxplot) с наложением диаграммы разброса. Статистические методы, используемые в анализе: тест Манна - Уитни - Уилкоксо-на, тест Крускала - Уоллиса;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- при обнаружении «мусора» в записях целесообразно исключить его из дальнейшего анализа. Если доля таких записей велика, анализ далее не проводится;

- целесообразно провести корреляционный анализ с учетом типа данных. В нашем случае мы применили коэффициент корреляции Спирмена;

- для исследования структуры в ответах целесообразно провести факторный анализ (результаты такого анализа необходимо воспринимать с большой осторожностью, так как данные измерены в ранговой шкале). Существуют методы, позволяющие проводить полноценный факторный анализ и в условиях ранговой шкалы, но в данном исследовании они не использовались в силу вспомогательной роли анализа, и методы data mining. В нашем случае хороший результат показали деревья решений - этот метод имеет значимое преимущество перед такими, как нейронные сети, SVM и т. п., выражающееся в высокой степени возможности интерпретации. В случае относительно малого количества записей целесообразно огрублять шкалу для целевой переменной.

Следует отметить, что для обработки данных и подготовки отчета и данной статьи проприетарное программное обеспечение не применялось вообще. Применение R и KNIME дает возможность обрабатывать массивы данных с применением широко спектра методов статистики и Data Mining, при этом не жертвуя удобством аналитика. Следует отметить и отличную визуализацию в R: получаемые диаграммы вполне подходят как для внутрен-

него аналитического отчета, так и для презентации.

Интересен тот факт, что такой инструмент, как R, ставший де-факто стандартом в статистических расчетах и data mining за

рубежом, мало используем в РФ. Фактически, можно говорить об одном-двух изданных учебниках [6, 7] и небольшом количестве материалов, свободно обращающихся в Сети.

Указанная обработка легко реализуема и в случае дистанционного проведения курсов, а построение обработки на базе Я и КММЕ позволяет легко добиться воспроизводимости.

Литература

1. R Core Team (2013) R: A language and environment for statistical computing. R Foundation for Statistical Computing [Electronic resource] // Vienna, Austria. URL: http://www.R-project.org/.

2. Michael R Berthold, Nicolas Cebron, Fabian Dill, Thomas R. Gabriel, Tobias Kotter, Thorsten Meinl, Peter Ohl, Christoph Sieb, Kilian Thiel, Bernd Wiswedel. Studies in classification, data analysis, and knowledge organization. knime: the konstanz information miner // Springer. 2007.

3. Taiyun Wei corrplot: Visualization of a correlation matrix. R package version 0.73 [Electronic resource]. - URL: http://CRAN.R-project.org/package=corrplot

4. H. Wickham. ggplot2: elegant graphics for data analysis // Springer New York. 2009.

5. Revelle, W. psych: Procedures for Personality and Psychological Research 73 [Electronic resource] // Northwestern University, Evanston, Illinois, USA. - URL: http://CRAN.R-project.org/ package=psych Version = 1.3.10.

6. Буховец А.Г. Статистический анализ данных в системе R: учебное пособие / А.Г. Буховец, П.В. Москалев, В.П. Богатова, Т.Я. Бирючинская; под ред. проф. А.Г. Буховца. - Воронеж: ВГАУ, 2010.

7. Наглядная статистика. Используем R! / А.Б. Шипунов, Е.М. Балдин, П. А. Волкова, А.И. Коробейников, С. А. Назарова, С.В. Петров, В.Г. Суфиянов. - М.: ДМК Пресс, 2012.

i Надоели баннеры? Вы всегда можете отключить рекламу.