УДК 519.254
РАЗРАБОТКА ПРОГРАММНОГО СРЕДСТВA ДЛЯ ПРОВЕДЕНИЯ ИССЛЕДОВАНИЙ С ПАРАЛЛЕЛЬНОЙ СТАТИСТИЧЕСКОЙ ОБРАБОТКОЙ РЕЗУЛЬТАТОВ
Кобылкин Д.С., кандидат технических наук, доцент кафедры информатики, Оренбургский государственный университет, Оренбург e-mail: kobylkin_ds@mail.ru
Майер С.Г., студент, направление подготовки 09.03.02 Информационные системы и технологии, Оренбургский государственный университет, Оренбург e-mail: sanctuary@yandex.ru
Аннотация. В статье рассматривается программное средство, предназначенное для проведения исследований социологической направленности и параллельной базовой статистической обработки результатов. Дается краткий анализ отрасли и обзор функционала программного средства.
Ключевые слова: статистика, программное обеспечение, опрос, исследование, регрессионный анализ, корреляционный анализ.
SURVEY RESEARCH SOFTWARE IMPLEMENTING REAL-TIME STATISTICAL ANALYSIS
Kobylkin D.S., Candidate of Technical Sciences, Associate Professor of the Department of Computer Science, Orenburg State University, Orenburg e-mail: kobylkin_ds@mail.ru
Mayer S.G., student, training direction 09.03.02 Information systems and technologies, Orenburg State University, Orenburg
e-mail: sanctuary@yandex.ru
Abstract. The paper describes a software product for conducting surveys implementing basic real-time statistical analysis. It shows short review of the field and picture main features of the software product implemented. Keywords: statistics, software, survey, research, regression analysis, correlation analysis.
Методы математической статистики представляют собой средство обработки данных, сочетающее в себе мощность с доступностью. В отличие от многих других инструментов математического анализа, математическая статистика часто позволяет обрабатывать данные в интуитивно понятной форме, одновременно обладая мощным аналитическим и прогностическим потенциалом. Она нашла широкое применение практически во всех прикладных областях, от научно-конструкторской до торго-во-финансовой.
Распространенным приложением математической статистики в научно-исследовательской деятельности является обработка результатов эмпирических исследований с целью выдвижения, подтверждения или опровержения теоретических гипотез. Говоря об эмпирическом исследовании, в значительном числе случаев мы будем подразумевать разного вида и рода опросы и анкеты. В педагогике, социологии, журналистике и других общественных и гуманитарных дисциплинах такой тип исследований будет представлен особо широко. Статистическая обработка результатов в этом случае зачастую проводится непосредственно автором
или авторами исследования, часто не обладающими необходимой профессиональной подготовкой. Помочь в этом им способны разнообразные вычислительные средства автоматизации. Примерами таких программных средств являются:
- Microsoft Excel. Табличный процессор от Microsoft позволяет предпринимать достаточно глубокую статистическую обработку с помощью подключаемого модуля «Анализ данных».
- StatSoft Statistica. Программный комплекс, сочетающий в себе большое число доступных методов анализа и представления данных с обширной справочной базой.
Эти и подобные им программы обладают, в общем случае, одним и тем же набором недостатков, которые проявляются при использовании специалистом без профильной подготовки:
- отсутствие средств интерпретирования полученных показателей;
- жесткие требования к форме представления данных;
- отсутствие интеграции с системами опросов. Перечисленные системы обладают архитектурой, отвлеченной от непосредственного типа реша-
емой задачи. Можно отметить отсутствие интеграции с популярными сервисами (такими, как Google Forms) и собственного функционала (формирование опросов, хранение результатов и т. п.).
В ходе исследования по созданию мотиваци-онного поля для успешного овладения дисциплинами студентами Оренбургского государственного университета была выявлена необходимость предоставить альтернативный программный продукт, предоставляющий преподавателям возможность воспроизводить данное исследование и анализировать полученные данные. В резуль-
тате преподаватель получал бы более глубокое представление о некоторых личностных особенностях учащихся и мог бы применять к ним дифференцированный подход более информированно и осознанно, чем прежде.
Для достижения цели был разработан интегрированный программный комплекс для проведения исследований с параллельной статистической обработкой результатов и функцией перенесения данных на основе опросов из систем электронного тестирования в системы статистической обработки при интеграции с внешними средствами.
Начать
Результаты
ОРЕНБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
Простое интегрированнс
MultiTest 0.1
! программное средство, предназначенное >вательских опросов параллельно о базовой статистической обработкой ответов "на лету".
Статистика
О программе
Р
Рисунок 1 - Стартовое окно программы
Комплекс носит название MultiTest (рисунок 1) и реализован на платформе .NET средствами языка программирования C#. Он позволяет формировать пользовательские опросы с различными типами ответов, хранить их в удобном для просмо-
тра и редактирования виде (в формате .хт1), проводить анкетирование, просматривать результаты, автоматически обрабатывать их и получать базовую интерпретацию итогов обработки.
Начать
Результаты Статистика
О программе
Выйти
Шгп 1 1 Ш
1_р ■ и П ГЯК1 1 Г-Е 1 1 1 Г 1
-1,25 -3.35 -3.45 -0,35 3,35 3.75 -1.05 -3,55 -3.25 0.15 3.55 3,35
, — Г : Г : • . вв ,---:':
-3,79 -0.3Э 0.01 3.41 0.S1 1.21 -0,53 -0.13 3.21 0.61 1.01
-1.33 -0.S3 -0.33
Доверительные интервалы
1
0.Б О -0.5 -1 -1.Б
,73 -0.3Э 0.01 0.41 0,Е1 1.21 -0.59 -0.19 0,21 0.61 1.01
Зависиллав пере/ленная: 3 С надежностью Р = 1 - 0..00 = 0,95 коэф<±>иценты регрессии находятся в доверительных интервалах: xl t H>,U;0272J; х2Е (-1,031;-0,639); хЗЁ (-0,109; 0,2591,
Рисунок 2 - Модуль статистической обработки
На данный момент комплекс реализует следующие методы статистического анализа (рисунок 2):
- дисперсионный анализ;
- многомерный регрессионный анализ с выделением предикторов и построением уравнения функциональной зависимости;
- проверка статистической надежности уравнения регрессии;
- проверка статистической значимости коэффициентов регрессии;
- вычисление доверительных интервалов коэффициентов;
- многомерный корреляционный анализ.
Данные каждого исследования хранятся в отдельном едином файле, который может быть загружен в любой момент для прохождения опроса, просмотра результатов или статистики. Оттуда же загружается текст вопросов, приветствия, варианты ответов и строки для построения комплексной динамической интерпретации результатов. К примеру, в нашем исследовании личностные особенности испытуемых оценивались по нескольким шкалам; фрагменты текста, соответствующие оценке по каждой из шкал, собранные вместе, представляли собой единый психологический профиль студента (рисунок 3).
Начать
Результаты
Статистика
О программе
Алиса Валентинвячеславовна Ивановпетровгайдн, 17
|н<г№ш на диаграмму, чтобы выбрать другое исследование)
+В не шн ./-Внутр. +Псзит./-Негат.
*Тревожн./-Констр. +/-Академ. успешн.
УМЕРЕННАЯ склонность к внутреннему мотивированию (через переживания, связанные с самой деятельностью - например, удовольствие от выполнения физических упражнений). УМЕРЕННЫЙ конструктивный подход.Не проявляет склонности кметодам позитивного или негативного мотивирования. Склоняется кмнению, что не испытывает никаких сложностей с академической успеваемостью.
Предсказанный тип мотивации: 0.21. исследованный:-0.14: разница составила 0.3486
Рисунок 3 - Индивидуальные результаты и их интерпретация
РП Г11КН У ПЭ1 I I I IЕЙ11
Рисунок 4 - Сравнение гистограмм распределения MultiTest и 81аЙ8Иса
Разработанное средство может использоваться для проведения прикладных исследований социологического характера людьми, обладающими базовой подготовкой оператора ПК. Оно не требует профессиональных навыков работы в специализированных математических вычислительных системах для получения результатов и их анализа.
С использованием разработанного средства
xl x2 x3 x4
► xl 0,5 -OA -0.5
XÎ 0.5 -0.3 -0.7
x3 -0.4 -0,3 0.6
x4 -0,5 -0,7 0.6
было успешно проведено исследование особенностей мотивации учащихся при занятиях физической культурой в вузе. С целью верификации результатов в ходе исследования применялись пакеты обработки данных Microsoft Excel и StatSoft Statistica (рисунок 4). Полученные с их помощью результаты соответствуют полученным с использованием нашего программного комплекса (рисунок 5).
Согласно критерию Чеддокщ,связь: ллег*дух1 и х2- СЛАБАЯ ллечеду х 1 и хЗ - СЛ АБ АЯ межру xl и х4 - СЛАБАЯ ЛА.ежду х2 и хЗ - Б Ы СО КАЯ лдечеду х2 и х4 - CF ЩН ЯЯ ллежду хЗ и х4 - CF ЩН ЯЯ
Л A В С D Е
1 2 Столбец Столбец Столбец Столбец А
Столбец] 1
3 Столбец; 0,500777 1
4 Столбец; -0,39155 -0,S252 1
5 Столбец\ -0,54243 -0,70124 0,612211 1
Рисунок 5 - Результаты корреляционного анализа MultiTest vs. Excel
По результатам проведенного исследования можно сделать вывод, что разработанное программное средство адекватным и наглядным образом представляет и обрабатывает данные опросов с использованием методов математической статистики. В силу универсальности, наглядности и до-
ступности можно рекомендовать МикП^ к использованию при составлении и анализе опросов в разнообразных сферах деятельности, в том числе авторами исследований, не располагающими глубокой математической подготовкой.
Литература
1. Вуколов Э. А. Основы статистического анализа. - М. Изд-во Форум. 2-е изд., 2008. - 464 с.
2. Кобылкин Д. С. Информационно-коммуникационные технологии при изучении информатики как средство мотивации учебной и научной деятельности бакалавров технических специальностей // Университетский комплекс как региональный центр образования, науки и культуры: материалы Всероссийской научно-методической конференции; Оренбургский гос. ун-т. - Оренбург: ООО ИПК «Университет», 2012. - С. 1630-1634.
3. Кобылкин Д. С. Повышение мотивации учебной деятельности студентов в высших учебных заведениях за счет применения кейс-технологий [Электронный ресурс] / Кобылкин Д. С., Юсупова О. В. // Актуальные направления фундаментальных и прикладных исследований : материалы XII междунар. науч.-практ. конф., 5-6 июня 2017 г., North Charleston USA. - Электрон. дан. - North Charleston: CreateSpace, 2017. - С. 54-57.
4. Becker R. A., Cleveland W. S., Wilks A. R. Dynamic graphics for data analysis // Statistical science. -1987. - pp. 355-383.
5. Mosteller F., Tukey J. W. Data analysis and regression: a second course in statistics // Addison-Wesley Series in Behavioral Science: Quantitative Methods. - 1977. - 588 p.