«ПЕДАГОГИКО-ПСИХОЛОГИЧЕСКИЕ И МЕДИКО-БИОЛОГИЧЕСКИЕ ПРОБЛЕМЫ ФИЗИЧЕСКОИ КУЛЬТУРЫ II СПОРТА» Электронный журнал Камской государственной академии физической культуры, спорта и туризма
Per. № Эл №ФС77-27б59 от 26 марта 2007 г. '
№8 (3/2008)
УДК 004.9
ИСПОЛЬЗОВАНИЕ КОМПЬЮТЕРНЫХ ПРОГРАММ ДЛЯ РЕГРЕССИОННОГО АНАЛИЗА ПРИ РЕШЕНИИ СПОРТИВНЫХ ЗАДАЧ
Кандидат педагогических наук, доцент Болгов В.Н. Камская государственная академия физической культуры, спорта и туризма
Набережные Челны
Старший преподаватель кафедры «ФВиС» Камалов Н.К.
ИНЭКА Набережные Челны
COMPUTER PROGRAMS USAGE FOR THE REGRESSION ANALYSIS UNDER
SPORT AIMS SOLVING
V.N. Bolgov, Ph.D., associate professor Kama State Academy of Physical Culture, Sport and Tourism
Naberezhnye Chelny
N.K. Kamalov, senior teacher «Physical Culture» board Kama State Engineer and Economy Academy Naberezhnye Chelny
e-mail: bvntat@yandex. ru
Ключевые слова: компьютерные программы, статистическая информация, регрессивный анализ, моделирование, прогнозирование.
Аннотация. В статье дается обзор компьютерных статистических программ применяемых при решении спортивных задач с использованием регрессионного анализа (спортивное моделирование и прогнозирование).
Key words: computer programs, statistics, regression analysis, modeling, prognostication.
Summary: There is the review of statistic computer program, which are used under sports aims solution with regression analysis usage, in the article (sport modeling and prognostication).
С появлением персональных компьютеров трудности вычисления перестали быть определяющими при выборе статистических методов анализа, а наличие современных статистических пакетов значительно облегчило задачу исследователя по обработке и интерпретации полученных
результатов. Сегодня проблема заключается в том что, не редко исследователи недостаточно хорошо осведомлены о возможностях компьютерных программ для обработки статистической информации, у них не хватает знаний, чтобы сформулировать задачи обработки полученных данных, ввести их в компьютер в соответствующем виде, пользуясь интерфейсом программы провести вычисления и интерпретировать полученные результаты.
Регрессионный анализ при решении спортивных задач применяется в случае, если необходимо определить вид связи между переменными, дать прогноз возможному значению выходной переменной, отталкиваясь на значения других переменных. В качестве примера можно привести задачи по прогнозированию спортивных достижений, анализу модельных характеристик спортсмена, моделированию тактических действий и др.[1].
Из всего разнообразия компьютерных программ для обработки статистической информации мы включили в наш обзор три. Во-первых, Microsoft Excel, как наиболее доступную и широко распространенную в России, во-вторых, SPSS, как программу для обработки статистической информации имеющую самую широкую поддержку в Интернете и, наконец, STATGRAPHICS Plus for Windows, как типичного представителя современных статистических пакетов.
Microsoft Excel предлагает широкий диапазон средств для анализа статистических данных. Такие встроенные функции, связанные с режимом «Регрессия», как ЛИНЕЙН (рассчитывает массив данных, описывающих уравнение линейной множественной регрессии), РОСТ (рассчитывает массив прогнозируемых значений результативного признака в соответствии с экспоненциальной кривой), ЛГРФПРИБЛ (рассчитывает массив данных, описывающих уравнение экспоненциальной регрессии), ПРЕДСКАЗ (рассчитывает для парной регрессии прогнозируемое значение результативного признака в соответствии с линейным трендом), ТЕНДЕНЦИЯ (рассчитывает массив прогнозируемых значений результативного признака в соответствии с линейным трендом, используется при экстраполяции и интерполяции рядов динамики), могут быть полезны для проведения несложного анализа данных. Более полный анализ можно провести, обратившись к пакету анализа. Чтобы получить к нему доступ выберите в меню Сервис команду Анализ данных.
Режим работы «Регрессия» служит для расчета параметров уравнения линейной регрессии и используется для анализа воздействия на отдельную зависимую переменную значений одной или более независимых переменных.
В диалоговом окне данного режима задаются следующие параметры:
1.Входные данные интервала Y (диапазон анализируемых зависимых данных.)
2. Входной интервал Х - (вводится ссылка на ячейки, содержащие
факторные признаки (диапазон независимых данных). Максимальное количество признаков - 16).
3. Уровень надежности - по умолчанию 95%. Установленный уровень надежности используется для проверки значимости коэффициента детерминации
4. Выходной интервал - диапазон, в который программа выведет результаты обработки ваших данных.
7. Остатки - установите данный флажок в активное состояние, если требуется включить в выходной диапазон столбец остатков
8. Стандартизованные остатки - установите флажок, если требуется включить в выходной диапазон столбец стандартизованных остатков
9. График остатков - установите флажок, если требуется вывести на рабочий лист точечные графики зависимости остатков от факторных признаков х;.
10. График подбора - установите флажок, если требуется вывести на рабочий лист точечные графики зависимости теоретических результативных значений у от факторных признаков х;.
11. График нормальной вероятности - установите флажок, если требуется вывести на рабочий лист точечный график зависимости наблюдаемых значений y от автоматически формируемых интервалов перцентилей. График строится на основе генерируемой таблицы «Вывод вероятности»
После запуска программы (нажатие на клавишу «ок») в диапазоне выходного интервала появляется ВЫВОД ИТОГОВ (три таблицы) ВЫВОД ОСТАТКА, ВЫВОД ВЕРОЯТНОСТИ и заказанные вами графики. Первая таблица итогов «Регрессионная статистика». В ней сгенерированы результаты, соответствующие следующим статистическим показателям:
• Множественный R - коэффициенту корреляции R;
• R-квадрат - коэффициенту детерминации R2;
• Стандартная ошибка - остаточному стандартному отклонению
• Наблюдения - числу наблюдений n
Вторая таблица - «Дисперсионный анализ». В ней сгенерированы результаты дисперсионного анализа, которые используются для проверки значимости коэффициента детерминации R2. Третья таблица - «Коэффициенты регрессии». В ней сгенерированы значения коэффициентов регрессии и их статистические оценки. В таблице «Вывод остатка» сгенерированы теоретические значения у; результативного признака Y и значения остатков. Наконец, в таблице «Вывод вероятности» сгенерированы интервалы перцентилей и соответствующие им эмпирические значения y.
Теперь можно переходить к анализу таблиц и интерпретации полученных результатов. Для этого рекомендуем воспользоваться помощью специальной литературы [4-6].
SPSS (Statistical Package for the Social Science). Программа имеет русифицированный интерфейс и в качестве помощи при проведении анализа полученных статистических результатов, которые выводятся на английском языке, имеется «Иллюстрированный самоучитель по SPSS» на русском языке. Как сказано в аннотации к нему - «Материал, изложенный в книге, достаточен для того, чтобы студент или молодой ученый сделали свои первые шаги в обобщении статистических
данных и поиске скрытых закономерностей, а умудренные опытом профессионалы обрели еще один мощнейший инструмент, повышающий эффективность практической деятельности»[2].
Кроме этого программа имеет мощную поддержку в Интернете. На специализированных сайтах вы найдете информацию справочного характера, сможете поучаствовать в обсуждении того или иного вопроса в форуме, наконец, попросить помощь у более опытных пользователей [7-11].
Чтобы вызвать регрессионный анализ в SPSS, выберите в меню Analyze... (Анализ) Regression... (Регрессия).
Мы уже отмечали, что важным этапом регрессионного анализа является выбор подходящей регрессионной модели. Существуют определенные условия для использования того или иного метода. Так для проведения линейного регрессионного анализа зависимая переменная должна иметь интервальную (или порядковую) шкалу. Выберите в меню Analyze... (Анализ) Regression...(Регрессия) Linear... (Линейная) Появится диалоговое окно Linear Regression (Линейная регрессия). Что касается графического представления результатов то через кнопку Plots...(Графики) можно получить графики прогнозируемых значений, на диаграмме рассеяния изобразить регрессионную прямую и т.д.
Если вам надо выявить зависимость дихотомической переменной от некой другой переменной, относящейся к любой шкале нужно воспользоваться бинарной логистической регрессией. Как правило, в случае с дихотомическими переменными речь идёт о некотором событии, которое может произойти или не произойти; бинарная логистическая регрессия в таком случае рассчитывает вероятность наступления события в зависимости от значений независимых переменных.
Выберите в меню Analyze... (Анализ) Regression... (Регрессия) Binary logistic... (Бинарная логистическая) Открывается диалоговое окно Logistic Regression (Логистическая регрессия).
Если зависимая переменная является категориальной, но имеет более двух категорий, то здесь подходящим методом будет мультиномиальная логистическая регрессия. В то время как, при бинарной логистической регрессии независимая переменная может иметь интервальную шкалу, то мультиномиальная логистическая регрессия пригодна только для категориальных независимых переменных, причём имеет значение, относятся ли они к шкале наименований или к порядковой шкале. Выберите в меню Analyze (Анализ) Regression ...(Регрессия) Multinomial Logistic... (Мультиномиальная логистическая). Откроется диалоговое окно Multinomial Logistic Regression (Мультиномиальная логистическая регрессия).
Для независимых переменных, относящихся к порядковой шкале, предусмотрен метод порядковой регрессии. В то время как, мультиномиальная регрессия предназначена для зависимой переменной, относящейся к номинальной шкале, то порядковая регрессия предназначена для целевой переменной, принадлежащей к порядковой шкале. Независимые переменные и здесь должны быть категориальными (то есть иметь номинальную или порядковую шкалу). Выберите в меню
Analyze (Анализ) Regression (Регрессия) Ordinal... (Порядковая). Откроется диалоговое окно Ordinal Regression (Порядковая регрессия).
С помощью SPSS, можно анализировать и нелинейные связи между переменными, которые относятся к интервальной шкале. Для этого предназначен метод нелинейной регрессии.
STATGRAPHICS Plus for Windows современная мощная компьютерная программа для анализа статистических данных. Она имеет экспертную систему StatAdvisor, которая интерпретирует результаты, полученные в ходе статистического анализа, и формулирует статистические выводы. Специальный инструмент StatGallery поможет вам в составлении отчетной документации, скомбинирует текст и графику в произвольном порядке или на одном листе.
Два пункта основного меню программы дают возможность обратиться к регрессионному анализу. Первый пункт Relate (отношение данных). Команды этого пункта меню позволяют выполнять простой (Simple Regression), полиномиальный (Polynomical Regression) и множественный (Multiple Regression) регрессионный анализ. Второй - Special (специальный) содержит Advanced Regression (расширенный регрессионный анализ).
Назначение и выбор регрессионной модели, технология работы по проведению анализов в STATGRAPHICS Plus близки к описанному нами пакету SPSS. Программа имеет обширную и подробную справочную информацию. К сожалению, она не переведена на русский язык и требует знания, как минимум, английской терминологии. Однако при желании использовать STATGRAPHICS Plus можно воспользоваться программами машинного перевода. Исходя из опыта автора, этого бывает достаточно для понимания не только навигации по программе, но и текста полученного анализа.
Мы не ставили цель создания практического пособия по работе с рассматриваемыми статистическими программами, да и в рамках статьи это сделать невозможно. Наша задача, показать возможности компьютерных программ для обработки статистической информации, заинтересовать исследователей проведением качественного статистического анализа, что, по нашему мнению, несомненно, повысит информативность экспериментальных работ в области спорта.
Литература
1. Баландин, В.И. Прогнозирование в спорте / В.И. Баландин, Ю.М. Блудов, В.А. Плахтиенко - М.: ФиС, 1986. -192 с.
2. Иллюстрированный самоучитель по SPSS [Электронный ресурс]. - Режим доступа: http://www.learnspss.ru /handbooks.htm
3. Катранов, А.Г. Компьютерная обработка данных экспериментальных исследований: учебное пособие / А.Г. Катранов, А.В. Самсонова; СПбГУФК им. П.Ф. Лесгафта. - СПб.: СПб ГУФК им. П.Ф. Лесгафта, 2005. - 132 с.
4. Макарова, Н. В. Статистика в Excel: учеб. пособие / Н. В. Макарова, В.Я. Трофимец. - М.: Финансы и статистика, 2002. - 368 с.
5. Статистика : обработка спортивных данных на компьютере: учеб. пособие для студ. высш. учеб. заведений физ. культуры / под ред. М.П. Шестакова, Г.И. Попова. - М.: СпортАкадемПресс, 2002. - 278 с.
6. Тюрин, Ю.Н. Анализ данных на компьютере / Ю.Н. Тюрин, А. А. Макаров. - М.: Финансы и статистика, 1995. - 384 с.
Glossary
1. Balandin, V.I. Sport prognostication / V.I. Balandin, и.М. Bludov, VA. Plakhtienko - М.: Physical culture and sport, 1986. - 192 p.
2. Self-study guide with pictures under SPSS [Electronic]. - online Режим: http://www.learnspss.ru /handbooks.htm
3. Katranov, А.в. Computer data processing for experimental researches: tutorial / А.в. Katranov, А-V. Samsonova; SPbGUPhC named after P.F. Lesgaft. - SPb.: SPbGUPhC named after P.F. Lesgaft, 2005. - 132 p.
4. Makarova, N. V. Excel statistics: tutorial / N. V. Makarova, V.J. Trofimets. - М.: Statistica and finance, 2002. - 368 p.
5. Statistics : Sport data computer processing: high school PC students tutorial / under ad. МР. Shestakov, G.I. Popov. -М.: SportAcademPress, 2002. - 278 p.
6. Tjurin, U.N. Computer data analysis / U.N. Tjurin, А.А. Makarova. - М. : Finance and statistics, 1995. - 384 p.