Научная статья на тему 'Разработка программного обеспечения для прогнозирования физической работоспособности человека на основе метода регрессионного анализа'

Разработка программного обеспечения для прогнозирования физической работоспособности человека на основе метода регрессионного анализа Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
716
102
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕГРЕССИОННАЯ МОДЕЛЬ / КОРРЕЛЯЦИЯ / ДИСПЕРСИОННЫЙ АНАЛИЗ / Т СТАТИСТИКА / FСТАТИСТИКА / КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ / ГЕТЕРОСКЕДАСТИЧНОСТЬ / C# / REGRESSION MODEL / CORRELATION / ANALYSIS OF VARIANCE / T STATISTICS / F-STATISTICS / COEFFICIENT OF DETERMINATION / HETEROSCEDASTICITY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Куи Тар Со

В статье представлены результаты исследований по созданию статистической модели физической работоспособности «здорового человека» методом регрессионного анализа, где в качестве факторов выступают физические параметры человека, а в качестве отклика показатель физической работоспособности. Уравнение регрессии строилось для каждой возрастной группы. После выполнения множественного регрессионного анализа получены множественные регрессионные модели, которые могут предсказать физическую работоспособность для подростков в возрасте от восьми до семнадцати лет. В статье приведены результаты анализа и разработка регрессионной модели для семнадцатилетних мальчиков. Также представлены проверки гипотез для модели, т.е проверка значимости модели, значимости коэффициентов, гетероскедастичности, автокорреляции, мультиколлинеарности и нормальности остатков. В результате для прогнозирования физической работоспособности человека выбран метод множественного регрессионного анализа статистики, который позволяет проводить анализ многофакторных статистических моделей. Разработаны регрессионные модели и программное обеспечение для прогнозирования физической работоспособности человека в возрасте от восьми до семнадцати лет. Определены значимые параметры для статистических моделей прогнозирования, с помощью которых быстро и эффективно можно оценить физическое здоровье человека в возрасте от восьми до семнадцати лет.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Куи Тар Со

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Software development for the prediction of human physical working capacity based on regression analysis

The paper presents results of research for the mathematical model of the physical working capacity of a "healthy person” in the regression analysis, where the factors are the physical parameters of the person, and as a response an indicator of physical working capacity. The regression equations constructed for each age group. After performing multiple regression analysis obtained multiple regression models that can predict the physical working capacity for human aged eight to seventeen years. Article shows the results of the analysis and development of the regression models for the boy of seventeen year old. Also presents the hypotheses testing, ie checking the significance of the model, the significance of the coefficients, heteroscedasticity, autocorrelation, multicollinearity and normality of residuals. In conclusion, developed the regression models and software for the prediction of physical working capacity, method selected multiple regression analysis in statistics, which allows the analysis of multivariate statistical models. Defined the relevant parameters for the regression equations to assess the physical health of girls between the ages of fourteen to seventeen years quickly and efficiently.

Текст научной работы на тему «Разработка программного обеспечения для прогнозирования физической работоспособности человека на основе метода регрессионного анализа»

Интернет-журнал «Науковедение» ISSN 2223-5167 http ://naukovedenie.ru/

Том 8, №1 (2016) http ://naukovedenie. ru/index.php?p=vol8-1

URL статьи: http://naukovedenie.ru/PDF/53TVN116.pdf

DOI: 10.15862/53TVN116 (http://dx.doi.org/10.15862/53TVN116)

Статья опубликована 04.03.2016.

Ссылка для цитирования этой статьи:

Куи Тар Со Разработка программного обеспечения для прогнозирования физической работоспособности человека на основе метода регрессионного анализа // Интернет-журнал «НАУКОВЕДЕНИЕ» Том 8, №1 (2016) http://naukovedenie.ru/PDF/53TVN116.pdf (доступ свободный). Загл. с экрана. Яз. рус., англ. DOI: 10.15862/53TVN116

УДК 004.4, 519.2

Куи Тар Со

ФГБОУ ВПО «Московский государственный технический университет имени Н.Э. Баумана», Россия, Москва1

Аспирант E-mail: kyithar82@gmail.com

Разработка программного обеспечения для прогнозирования физической работоспособности человека на основе метода регрессионного анализа

Аннотация. В статье представлены результаты исследований по созданию статистической модели физической работоспособности «здорового человека» методом регрессионного анализа, где в качестве факторов выступают физические параметры человека, а в качестве отклика - показатель физической работоспособности. Уравнение регрессии строилось для каждой возрастной группы. После выполнения множественного регрессионного анализа получены множественные регрессионные модели, которые могут предсказать физическую работоспособность для подростков в возрасте от восьми до семнадцати лет. В статье приведены результаты анализа и разработка регрессионной модели для семнадцатилетних мальчиков. Также представлены проверки гипотез для модели, т.е проверка значимости модели, значимости коэффициентов, гетероскедастичности, автокорреляции, мультиколлинеарности и нормальности остатков. В результате для прогнозирования физической работоспособности человека выбран метод множественного регрессионного анализа статистики, который позволяет проводить анализ многофакторных статистических моделей. Разработаны регрессионные модели и программное обеспечение для прогнозирования физической работоспособности человека в возрасте от восьми до семнадцати лет. Определены значимые параметры для статистических моделей прогнозирования, с помощью которых быстро и эффективно можно оценить физическое здоровье человека в возрасте от восьми до семнадцати лет.

Ключевые слова: регрессионная модель; корреляция; дисперсионный анализ; т -статистика; F- статистика; коэффициент детерминации; гетероскедастичность; C#

1 105005, Россия, Москва, Госпитальный пер., д. 4/6, корп. 1 1

Введение

В настоящее время мало кто уделяет внимание физкультуре. Все больше и больше времени люди проводят перед компьютером и телевизором. От этого мышцы спины, ног, шеи и т.д. слабеют, а человек больше подвержен болезням. С другой стороны, необходимость количественного измерения соматического здоровья, оценки его резервов приобретает особую актуальность, в связи с реализуемым в настоящее время по инициативе Президента РФ национальным проектом «Здоровье». В Послании Федеральному собранию в 2005 году В.В. Путин отметил, что «необходимо возродить профилактику заболеваний как традицию российской медицинской школы» [9]. Иными словами, подтверждено, что предупреждение болезней и укрепление здоровье - самое главное, что должно занимать властные структуры, медицинскую науку и практическое здравоохранение. В связи с этим разрабатываемая система донозологического контроля физического здоровья и работоспособности с использованием показателей, хорошо понятных рядовым гражданам, может сыграть важную роль в перестройке общественного мировоззрения и формирования высокой культуры здоровья населения. Особую важность эта проблема приобретает в связи с поставленной 10 мая 2006 года Президентом в послании Федеральному собранию РФ важнейшей задачей - повышению рождаемости. Для этих ситуации физическая работоспособность человека станется важной для здоровья в человечестве.

Физическая работоспособность - один из важнейших компонентов физического здоровья человека. Она характеризует способность организма эффективно выполнять большую мышечную работу и противостоять утомлению. Уровень общей физической работоспособности определяется возможностями мышечной, дыхательной, сердечнососудистой, нервной, эндокринной систем и слаженностью их работы при физических нагрузках. Физическая работоспособность рассчитывается в величинах мощности выполняемой нагрузки (кгм/мин) в расчете на 1 кг массы тела, соответствующей ЧСС 170 уд/мин.

Целью работы является разработка программного обеспечения статистических моделей для прогнозирования физической работоспособности с использованием метода множественного регрессионного анализа для подростков в возрасте от 8 до 17 лет.

Для прогнозирования физической работоспособности используем метод множественного регрессионного анализа. Регрессионный анализ является методом моделирования измеряемых данных и исследования их свойств. Данные состоят из пар значений зависимой переменной (переменной отклика) и независимой переменной (объясняющей переменной). Регрессионная модель имеет функцию независимой переменной и параметров с добавленной случайной переменной. Множественная регрессионная модель населения представляет в следующем виде:

где Y - отклик (зависимая переменная), Во - оценка постоянной составляющей, В; - г-ый коэффициент множественной регрессии, Хг - г-ая независимая переменная, е - ошибка;

1. Метод анализа и параметры

X =Б0+Б1Х1+Б2Х2+.+БпХп+^,

(1)

(г=0,1,..,п).

Х — матрица независимых переменных, размерность т*п;

В — вектор столбец параметров, подлежащих оцениванию, размерность п*1 (коэффициентов регрессии);

8 — случайный вектор-столбец размерности п х 1 ошибок наблюдений (остатков).

В анализе используются двенадцать морфологических и функциональных показателей для группы девушек и мальчиков в возрасте от 8 до 17 лет, представленных в таблице 1. После измерения морфологических и функциональных показателей физического здоровья человека проведен анализ полученных результатов. Предполагаем, что построить прогноз значений параметра PWC (физическая работоспособность) с помощью множественной регрессии. В этом случае необходимо выяснить математическую зависимость физической работоспособности человека от измеряемых морфологических и функциональных показателей.

Таблица 1

Параметры для регрессионного анализа

Символ Определение символа Сокращение Определения символов

Y отклик (PWC170- физическая работоспособность) кгм/кг в мин PWCm/кг

X! жизненная емкость легких, мл ЖЕЛ

X2 пульс в покое (частота сердечных сокращений, уд/мин) ЧСС

Хз систолическое артериальное давление, мм. рт. ст. АД-С

Х4 диастолическое артериальное давление, мм. рт. ст. АД-Д

Х5 задержка дыхания, сек Гипокс.

Х6 весоростовой коэффициент (Кетле), гр/см Кетле

Х7 гибкость позвоночника, см Гибк.

Х8 координация движения (бросание в стену теннисных мячей, количество пойманных мячей из 6) Коорд

Х9 зрительно-двигательная реакция (тест с падающей линейкой, см) ЗРД

Х10 мышцы плечевого пояса (отжимание) Отжим

Х„ мышцы брюшного пресса (пресс) Пресс

Х12 тест Руфье (приседание) Руфье

В данной статье, будет представлена только модель для семнадцатилетних мальчиков. Приведенный анализ 2400 мальчиков и девушек в возрасте от 8 до 17 лет в медицинской компании «Народный Спорт Парк» [8] применен в данной работе. Выборка по каждой группе составляла 120 человек.

2. Регрессионный анализ для семнадцатилетних мальчиков

Запускаем регрессионный анализ (использовано программное обеспечение MS Excel и SPSS) и рассмотрим приведенные результаты анализа для 120-ти пятнадцатилетних девушек. После вычисления регрессии с помощью программных пакетов, в первую очередь, необходимо смотреть в таблицу дисперсионного анализа. Для проверки значимости уравнения или качества уравнения регрессии в целом производится на основе F-критерия

Интернет-журнал «НАУКОВЕДЕНИЕ» Том 8, №1 (январь - февраль 2016)

http://naukovedenie.ru publishing@naukovedenie.ru

Фишера, которому предшествует дисперсионный анализ. Дисперсионный анализ можно вычислить по таблице 2.

Таблица 2

Схема дисперсионного анализа

Компоненты дисперсии Сумма квадратов Число степеней свободы Дисперсия на степень свободы (среднее квадратов)

Факторная (регрессия) n I (У - У)2 i=1 k n I ( - У )2 е2 _ ¡=1 факт

Остаточная n I ((- У )2 ¡=1 n-k-1 n I (У - У )2 S2 — i=! ост т л n - k -1

Общая n I (У - У)2 i=1 n-1 n I (У - У )2 S2 = ¡=1 общ л n-1

Здесь п - число наблюдений, к - число параметров при переменной ^ поэтому F-критерия Фишера можно вычислить по формуле:

S2

р _ факт _ ¡=1

I (У - У )2А

О 2 n /

S°cm I(У-У? n-k-1

i =1

Фактическое значение F-критерия Фишера сравнивается с табличным значением Fтабл. (а, k1, k2) при заданном уровне значимости а и степенях свободы k1= k и k2=n-k-1. При этом, если фактическое значение F-критерия больше табличного Рфакт > Ртабл, то признается статистическая значимость уравнения в целом. В соответствии с дисперсионным анализом, выяснить полезность линии регрессии можно с помощью величины F-статистики. В этом случае, вычисленная F-статистика = 3,0298 (и сравним F-критерия в F таблице = 1,8337), вычисленная F-статистика больше F-критерия и можно сказать, что регрессионная модель является статистическим значимым. В таблице 3 приведены вычисленные результаты дисперсионного анализа для шестнадцатилетних мальчиков.

Таблица 3

Дисперсионный анализ (ANOVA) для семнадцатилетних мальчиков

ANOVA

Степень свободы сумма квадратов Дисперсия на степень свободы (среднее квадратов) F Значимость F

Факторная (Регрессии) 12 334,0213 27,8351 5,3844 0,0000

Остаточная 107 553,1454 5,1696

Общая 119 887,1667

После проверки значимости уравнения регрессии можно рассмотреть коэффициента множественной детерминации R2. Использование R2 для оценки качества модели обладает тем недостатком, что включение в модель нового фактора (даже несущественного) автоматически увеличивает величину R2. Поэтому, при большом количестве факторов, предпочтительнее использовать, так называемый улучшенный, скорректированный коэффициент множественной детерминации R2, определяемый соотношением:

i (у, - У )2/* - к -1 и 1

Я2 = я = 1 - ^-—,-= 1 -^Ч (1 - я2),

—\2 л п - к -1

(У, - У ) * -1

1=1 /

i (у - У)2 i (у, - у )2

я2 = -= 1 - -.

i (У - У)2 i (у, - у)2

1=1 г=1

В таблице 4 приведены вычисленные результаты R2, R2 a и стандартной ошибки оценки. В этом случае, регрессионная модель означает, что 15,8% изменчивости зависимой переменной Y. Это объясняется изменчивостью независимых переменных Хь Здесь стандартная ошибка оценки - это мера точности предсказаний. В линии регрессии, тем меньше стандартная ошибка оценки, тем точнее предсказания. стандартная ошибка оценки можно вычислить по формуле:

^ =

1

I (у,-У,

г=1

п - 2

где сте^ - стандартная ошибка оценки, у - предсказанное значение, у - отклик, п -число наблюдение.

Таблица 4

Регрессионный вывод для 10 летних девочек

Модель R R2 R2a Стандартная ошибка оценки

17 - лет мальчиков 0,614 0,377 0,307 2,274

После этого необходимо рассмотреть коэффициенты регрессионной модели. Для получения коэффициентов регрессии можно использовать метод наименьших квадратов, который основан на минимизации суммы квадратов остатков регрессии. Согласно методу наименьших квадратов, вектор-столбец оценок коэффициентов регрессии получается по формуле:

р = (ХТХ)X г г,

где Хт - транспонированная матрица независимых переменных, (ХТХ)-1 - обратная матрица от произведения транспонированной матрицы независимых переменных на саму матрицу независимых переменных, Y - вектор наблюдений.

Для проверки значимости коэффициентов регрессии необходимо использовать критерий Стьюдента. Использование критерия Стьюдента (Т-критерия) сводится к сравнению

значения т-статистики со значением Т-критерия в Т-таблице с учетом принятого уровня значимости (а) и числа степеней свободы вариации k(v) = n-2. В случае, если вычисленное т-значение больше или равно критическому значению Т в Т-таблице, можно сделать вывод, что регрессионный коэффициент является статистически значимым. т-статистика можно вычислить по формуле:

// ч b t (b) = b '

где, t(b) - т-статистика одного коэффициента, b - коэффициент регрессии i, Sb -

стандартная ошибка коэффициента регрессии. Здесь стандартная ошибка коэффициента регрессии можно вычислить по формуле:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

n

о _ |о2 YTYY1- ^(Уг -У)2 Sb -У ост-( X X ) ' SL = i-1 , 1 .

n - к -1

Далее проверяются мультиколлинеарности для модели. Мультиколлинеарность представляет собой статистический феномен, в котором два или более регрессора сильно коррелируют в модели множественной регрессии. Можно проверит с использованием VIF. Если VIF больше 5, то мультиколлинеарность существует в модели:

VIF =

Sl(n - 1)S

J c2

ост

S2

Здесь, VIF - отклонение коэффициента инфляции (Variance Inflation Factor), Sx -

стандартное отклонение xj, S - стандартная ошибка коэффициента регрессии, S^ - средне-

квадратическая остаточная. В таблице 5, приведены вычисленные значения коэффициентов регрессии, величины т-статистики, VIF и т.д. В таблице, видно что, т-статистики для коэффициентов (b1, b2 и Ы2) больше чем Т-критерия (tb1,b2,b12 > ^абл = 1.646 (n=120, а=0.05%)). Соответственно т-статистики, эти коэффициенты являются статистическими значимыми. Величины VIF меньше чем 5 и можно считать, что мультиколлинеарность отсутствует в модели.

Таблица 5

Коэффициенты регрессионной модели семнадцатилетних мальчиков

коэффициенты стандартные ошибки т-статистики P-value Коллинеарность статистика

толерантность VIF

Констант b0= 17,2791 2,8492 6,0646 0,0000

ЖЕЛ b:= 0,0006 0,0003 2,2088 0,0293 0,843 1,186

ЧСС b2= -0,0359 0,0157 -2,2898 0,0240 0,818 1,223

АД-С bs= 0,0053 0,0206 0,2546 0,7996 0,601 1,663

АД-Д b4= -0,0144 0,0249 -0,5791 0,5638 0,723 1,383

гипокс bs= 0,0095 0,0092 1,0297 0,3055 0,908 1,102

Кетле b6= 0,0006 0,0041 0,1361 0,8920 0,829 1,206

гибк bv= 0,0222 0,0295 0,7522 0,4536 0,856 1,169

коорд b8= 0,0219 0,0608 0,3604 0,7192 0,858 1,165

ЗРД b9= -0,0102 0,0278 -0,3659 0,7152 0,934 1,071

отжим Ью= 0,0163 0,0261 0,6264 0,5324 0,800 1,249

пресс b11= 0,0330 0,0371 0,8889 0,3760 0,879 1,138

Руфье b12= -0,6429 0,1015 -6,3363 0,0000 0,928 1,077

Для прогнозирования значения параметра PWCl7o/кг необходимо подставить в формулу (1) значения коэффициентов из таблицы 5:

У = 17,2791 + 0,0006х - 0,0359х + 0,0053х - 0,0144х + 0,0095х

12345 (2) +0,006хб + 0,0222х7 + 0,0219х8 -0,0102х9 + 0,0163х10 + 0,0330хп -0,6429х12,

После получения регрессионной модели, в соответствии с тестированием т-статистики пренебрегаем незначимыми параметрами. Поэтому без использования незначимых параметров перезапускаем регрессию. Считаем, что модель со всеми предикторами - полная модель. А модель, которая содержит лишь некоторые из этих предсказателей, называется уменьшенной моделью.

После перезапуска регрессии рассматривается значимость уменьшенной модели. В таблице 6 показано, что F-статистика равна 20,8144, сравним с F-критерий в F таблице распределения. Значение F-статистики (20,8144) больше, чем значение F -критерия ^табл. 2,6802). Соответственно, будем считать, что можно отвергнуть нулевую гипотезу. Поэтому, уменьшенная регрессионная модель является статистической значимой. Кроме того, для изменчивости модели рассмотрим вычисленное значение скорректированного множественного коэффициента детерминации R2a. В таблице 7 показано, что значение R2a равно 0,333 (33,3%), уравнение регрессии составляет 33,3% дисперсии результативного признака.

Таблица 6

Дисперсионный анализ для семнадцатилетних мальчиков

ANOVA

Степень свободы сумма квадратов Среднеквадратическая F Значимость F

Регрессия 3 310,4495 103,4832 20,8144 0,0000

Ошибка 116 576,7172 4,9717

Общий 119 887,1667

Таблица 7

Регрессионный вывод для семнадцатилетних мальчиков

Модель R R2 R2a Стандартная ошибка оценки

17 летнихальчиков 0,592 0,350 0,333 2,229

Затем необходимо рассмотреть значимость коэффициентов уменьшенной модели. В таблице 8 представлены вычисленные регрессионные коэффициенты для уменьшенной модели, с помощью которых получается регрессионная модель (3), используя соотношение (1). После этого выполняется проверка гипотезы для коэффициента регрессии. В таблице 8 Т-статистики всех коэффициентов Ъ больше чем Т-критерия (Ттабл = 1,645, n =120, а = 0,05%). Следовательно, все коэффициенты являются статистическими значимыми. Также все величины VIF меньше чем 5 и можно сделать вывод, что в уменьшенной модели отсутствует мультиколлинеарность.

Таблица 8

Коэффициенты регрессионной модели семнадцатилетних мальчиков

коэффициенты стандартные ошибки Т-статистики P-value Коллинеарност ь статистика

толерантност ь VIF

Констант 18,0105 1,8457 9,7581 0,0000

ЖЕЛ 0,0007 0,0003 2,5563 0,0119 0,966 1,035

ЧСС -0,0298 0,0142 -2,1075 0,0372 0,998 1,002

Руфье -0,6434 0,0976 -6,5956 0,0000 0,964 1,037

Для прогнозирования значения параметра PWCl7o/кг необходимо подставить в формулу (1) значения коэффициентов из таблицы 8:

(3)

y = 18,0105 + 0,0007х - 0,0298х2 - 0,6434х

3. Сравнение двух моделей

После этого, можно использовать метод (Partial F тест) для сравнения двух моделей. Вычисленная величина Partial F равно 0.5066. В F-таблице указывает F - критерию, которая равна 1.9588 (а = 0.05, df1=9, df2=107) в уровни значимости а = 0.05(5%). В этом случае необходимо рассмотреть следующие ситуации, если Н0: Fрасч < Fтабл - умненьшенная модель лучше, H1: Fрасч > Fтабл - польная модель лучше. По результатам сравнения полной модели (2) с уменьшенной моделью (3) оказывается, что в анализе шестнадцатилетних мальчиков, уменьшенная модель лучше полной модели. Для сравнения двух моделей с помощью формулы (теста Multiple Partial F):

PartialF

(SSR - SSR )/q

\ полная уменьшенная' 1

MSE

Где, SSR - сумма квадратов регрессии, МSE - средне-квадратическая остаточная, q -разница между количествами регрессоров из двух моделей.

4. Анализ остатков

Проанализированы остатки уменьшенной модели. Для проверки анализа остатков рассматривается стандартизированная остаточная гистограмма, в которой показаны остатки нормального распределения и общая форма является приемлемой. Среднее значение равно -2,56е-16 и стандартное отклонение равно 0,987. На Рис. 6 приведены результаты проверки нормальности остатков.

Рисунок 1. Гистограмма для стандартизированных остатков

После этого, рассмотрим проверку гетероскедастичность модели. Под гетероскедастичностью понимают неравные дисперсии остатков модели (проблема в дисперсии остатков). Рассматрим точечную диаграмму (Рис. 2) для проверки гетероскедастичности остатков, в этой остаточной точечной диаграмме формы нарушения гетероскедастичности не видно, отсюда можно сделать вывод, что гетероскедастичность отсутствует в уменьшенной модели.

По математическому подходу, после вычисления, сравнивая величину Бройша Пагана с критерием хи-квадрат в таблице распределения хи-квадрата, получим величину Бройша Пагана = 4,21 и в таблице критическая величина хи-квадрата = 7,815. Очевидно, что величина Бройша Пагана меньше критерия хи-квадрат, что означает отсутствие гетероскедастичности в уменьшенной регрессионной модели.

Рисунок 2. Точечная диаграмма остатков для 17 летних мальчиков

Затем, для обнаружения положительной автокорреляции можно использовать тест Дарбина Уотсона. Автокорреляция — статистическая взаимосвязь между последовательностями величин одного ряда, взятых со сдвигом, например, для случайного процесса со сдвигом по времени. По тесту Дарбина Уотсона d = 1,863 и в таблице указывается d нижняя = 1,584, d верхняя = 1,665. Поэтому величина Дарбина Уотсона d > d верхняя и можно считать, что положительная автокорреляция отсутствует в модели. Тест Дарбина Уотсона можно вычислить по следующей формуле:

d

S t=2 ( et et-1 )

S

e t=1 t

где Т-число наблюдений, е - остатки.

В результате получим, что после проверки гипотезы ^-тест, ^тест, и т.д.), модель множественной регрессии физической работоспособности семнадцатилетних мальчиков является полезной, и найдено применение для оценки состояния здоровья подростков. Другие регрессионные модели для восми до семнадцатилетних юношей и девушек также позволяют получить аналогичные результаты.

T

5. Разработка программного обеспечения

После получения результатов модели пятнадцатилетних девушек разработана программа на языке С# с использованием Microsoft Visual Studio 2012. При использовании данной программы потребитель должен вводить вводные данные с помощью клавиатуры. Соответственно программа рассчитает физическую работоспособность. После расчета программа дает предсказанную физическую работоспособность на экране. Расчет функции для пятнадцатилетних девушек по программе выглядит следующим образом:

private void femalel5() {

//define coefficient of the model of 15 year old girls

double[] femalel5 = new double[7];

femalel5[0] = 18.6021;

femalel5[l] = -0.0347;

femalel5[2] = -0.0096;

femalel5[3] = -0.0516;

femalel5[4] = 0.0584;

femalel5[5] = 0.0614;

femalel5[6] = -0.4216;

// changing string to dounle from input data string strHR = txtHR.Text;

string strWeightHight = txtVJeightHeight .Text; string strCatchBall = txtCatchBall.Text; string strRulerTest = txtRulerTest.Text; string strBelly = txtBellyPress,Text; string strSitJps = txtSitUps.Text;

double HR = double.Parse(strHR, System.Globalization.Culturelnfo.InvariantCulture);

double weightHeight = double.Parse(strWeightHight, System.Globalization.Culturelnfo.InvariantCultureJj double catchBall = double,Parse(strCatchBall, System.Globalization.Culturelnfo.InvariantCulture); double rulerTest = double,Parse(strRulerTest, System.Globalization.Culturelnfo.InvariantCultureJj double Belly = double.Parse(strBelly, System.Globalization.Culturelnfo.InvariantCulture); double sitUps = double.Parse(strSitJps, System.Globalization.Culturelnfo.InvariantCulture)j // assign model of 15 yrs old girls

double pwc = femalel5[0] + (femalel5[l] * HR) + (femalel5[2] * weightHeight) +

(female15[3] * catchBall) + (femalel5[4] * rulerTest) + (femalel5[5] * Belly) + (femalel5[6] * sitJps); // showing Output PWC| labell.Text = labell.Text +■ pwc;

Рисунок 3. Расчета функции для пятнадцатилетних девушек

В программе пользователь может выбрать модель для возраста и пола. После этого пользователю необходимо ввести данные в соответствующее поле, и потом нажать кнопку "Calculate" и программа покажет вычисленный результат прогнозируемой физической работоспособности. Программа отображает следующим образом:

Рисунок 4. выбрать возраст и пол в программе

Рисунок 5. вводить данные для расчета

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Заключение

1. Для прогнозирования физической работоспособности человека выбран метод множественного регрессионного анализа статистики, который позволяет проводить анализ многофакторных статистических моделей.

2. Разработаны регрессионные модели для прогнозирования физической работоспособности человека в возрасте от восьми до семнадцати лет.

3. Разработано программное обеспечение для прогнозирования физической работоспособности человека в возрасте от восьми до семнадцати лет.

4. Определены значимые параметры, с помощью которых быстро и эффективно можно оценить физическую работоспособность человека в возрасте от восьми до семнадцати лет.

5. По результатам регрессионного анализа, регрессионные модели человека в возрасте от восьми до семнадцати лет являются статистически значимыми и могут быть использованы при оценке состояния здоровья.

6. Найдены значимые параметры для оценки физической работоспособности человека в возрасте от восьми до семнадцати лет.

ЛИТЕРАТУРА

1. Математическая статистика: Учеб. Для вузов / В.Б. Горянинов, И.В. Павлов, Г.М. Крищенко. -2-е изд., стереотип. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2002. - 424 с. (Сер. Математика в техническом университете; Вы. XVII).

2. Applied regression analysis: a research tool. - 2nd ed. / John O. Rawlings, Sastry G. Pentula, David A. Dickey. Изд-во - (Springer texts in statistics), - 671 p.

3. Statistical Models: Theory and Practice, David A. Freedman, Cambridge University Press (2005), - 414 p.

4. Modeling and interpreting interactive hypotheses in regression analysis, Cindy D. Kam and Robert J. Franzitsi Jr., University of Michigan Press (2009), - 168 p.

5. Regression analysis by example. - 4th ed. / Samprit Chatterjee, Ah S. Hadi, Wiley series in probability and statistics Established by Walter A. Shewhart and Samuel S. Wilks, - 366 p.

6. Multiple regression in behavioral research (Explanation and prediction), - 3rd ed / Elazar J. Pedhazur. Изд-во - Thomson Learning, 1997. - 1072p.

7. Linear Regression Analysis: Assumptions and Applications, John P. Hoffmann Department of Sociology Brigham Young University (2005), - 259 p.

8. Народный СпортПарк. Режим доступа: http://sportpark.ru/ (дата обращения 15.12.2015).

9. President of Russia, Address to Federal Assembly Russia. Режим доступа: http://archive.kremlin.ru/eng/speeches/2005/04/25/2031_type70029type82912_87086. shtml (дата обращения 15.12.2015).

Kyi Thar Soe

Bauman Moscow State Technical University «BMSTU», Russia, Moscow

E-mail: kyithar82@gmail.com

Software development for the prediction of human physical working capacity based on regression analysis

Abstract. The paper presents results of research for the mathematical model of the physical working capacity of a "healthy person" in the regression analysis, where the factors are the physical parameters of the person, and as a response - an indicator of physical working capacity. The regression equations constructed for each age group. After performing multiple regression analysis obtained multiple regression models that can predict the physical working capacity for human aged eight to seventeen years. Article shows the results of the analysis and development of the regression models for the boy of seventeen year old. Also presents the hypotheses testing, ie checking the significance of the model, the significance of the coefficients, heteroscedasticity, autocorrelation, multicollinearity and normality of residuals. In conclusion, developed the regression models and software for the prediction of physical working capacity, method selected multiple regression analysis in statistics, which allows the analysis of multivariate statistical models. Defined the relevant parameters for the regression equations to assess the physical health of girls between the ages of fourteen to seventeen years quickly and efficiently.

Keywords: regression model; correlation; analysis of variance; t - statistics; F-statistics; the coefficient of determination; heteroscedasticity; C#

REFERENCES

1. Matematicheskaya statistika: Ucheb. Dlya vuzov / V.B. Goryaninov, I.V. Pavlov, GM. Krishchenko. -2-e izd., stereotip. - M.: Izd-vo MGTU im. N.E. Baumana, 2002. - 424 s. (Ser. Matematika v tekhnicheskom universitete; Vy. XVII).

2. Applied regression analysis: a research tool. - 2nd ed. / John O. Rawlings, Sastry G. Pentula, David A. Dickey. Izd-vo - (Springer texts in statistics), - 671 p.

3. Statistical Models: Theory and Practice, David A. Freedman, Cambridge University Press (2005), - 414 p.

4. Modeling and interpreting interactive hypotheses in regression analysis, Cindy D. Kam and Robert J. Franzitsi Jr., University of Michigan Press (2009), - 168 p.

5. Regression analysis by example. - 4th ed. / Samprit Chatterjee, Ah S. Hadi, Wiley series in probability and statistics Established by Walter A. Shewhart and Samuel S. Wilks, - 366 p.

6. Multiple regression in behavioral research (Explanation and prediction), - 3rd ed / Elazar J. Pedhazur. Izd-vo - Thomson Learning, 1997. - 1072p.

7. Linear Regression Analysis: Assumptions and Applications, John P. Hoffmann Department of Sociology Brigham Young University (2005), - 259 p.

8. Narodnyy SportPark. Rezhim dostupa: http://sportpark.ru/ (data obrashcheniya 15.12.2015).

9. President of Russia, Address to Federal Assembly Russia. Rezhim dostupa: http://archive.kremlin.ru/eng/speeches/2005/04/25/2031_type70029type82912_87086. shtml (data obrashcheniya 15.12.2015).

i Надоели баннеры? Вы всегда можете отключить рекламу.