Научная статья на тему 'Математическая статистика в спорте'

Математическая статистика в спорте Текст научной статьи по специальности «Математика»

CC BY
5935
524
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Математическая статистика в спорте»

УЧЕНЫЕ - ПРАКТИКЕ

В.В. Афанасьев, И.Н. Непряев

Математическая статистика в спорте

Применение методов математической статистики в спортивных играх, как правило, ограничивается указанием набранных очков, числом побед, ничьих, поражений, разностью забитых и пропущенных шайб (или мячей). Приводятся сравнения результатов отдельных команд или игроков в двух или нескольких первенствах, но не анализируются совокупные результаты всех команд или игроков по их амплуа. Этот пробел авторы пытаются устранить, рассматривая и анализируя результаты хоккейного сезона. Обращение к хоккею вызвано, с одной стороны, популярностью в России этого вида спорта, да и недавно закончившемся чемпионатом, в котором, кстати, «Локомотив» стал бронзовым призером, а с другой - тем, что один из авторов является профессиональным хоккеистом.

В работе предлагается использовать коэффициент корреляции для нахождения степени зависимости тех или иных показателей хоккейных команд или игроков (нападающих, защитников, вратарей) по итогам чемпионата или сравнивать эти показатели в разных чемпионатах или на различных его этапах.

Такой подход может быть применен не только к анализу в командных видах спорта, но и в личных, таких, как легкая и тяжелая атлетика, плавание, конькобежный или лыжный виды и другие. Грамотное использование вероятностно-статистических методов позволит планировать, а при необходимости и корректировать организацию учебно-тренировочного процесса.

Понятие корреляции является одним из основных понятий теории вероятностей

и математической статистики, оно было введено Гальтоном и Пирсоном. Закон природы или общественного развития может быть представлен описанием совокупности взаимосвязей. Если эти зависимости стохастичны, а анализ осуществляется по выборке из генеральной совокупности, то данная область исследования относится к задачам стохастического исследования зависимостей, которые включают в себя корреляционный, регрессионный, дисперсионный и ковариационный анализы.

В качестве измерителей степени тесноты парных связей между количественными переменными будем использовать коэффициент ранговой корреляции. Пусть объекты генеральной совокупности обладают двумя качественными признаками и выборка объема п содержит независимые объекты, которые будем располагать (ранжировать) в порядке ухудшения качества. Для оценки степени связи признаков вводят коэффициенты ранговой корреляции Спирмена и Кендалла (см., например [1. С. 185-190]). Рассматривая ранги х1, х2, ..., хп как возможные значения случайной величины Х, а у1, у2, ., уп - как возможные значения случайной величины У, можно вычислить выборочный коэффициент корреляции Спирмена:

г, = 1 - -

(п -1) • п • (п + 1)

у. (разность соответствующих рангов). Предпочтение отдаем коэффициенту Спирмена, поскольку он дает более точный результат.

Заметим, что при равных показателях у нескольких участников им присваивается один общий ранг, равный среднему

арифметическому соответствующих возможных мест.

Коэффициент корреляции может принимать значение от минус единицы до плюс единицы, причем при г = 1 связь прямая, а при г = -1 - обратная. Считают, что если:

г <0,3, то связь слабая;

0,3 < г < 0,7 - связь средняя;

0,7 < г < 1 - связь сильная.

В том случае, когда исследуется связь между несколькими признаками, корреляцию называют множественной и она задается всеми коэффициентами г^ парных корреляций, которые записывают в корреляционную матрицу:

Г1 Г12 Г13 . г ^ '1п

1 Г23 . .. Г2п

(Г) = 1 . .. Г3п

V 1 ,

Заметим, что матрица (г) является треугольной, поскольку Гу = Г|і и нет смысла их повторять дважды.

1. Итоги чемпионатов мира по хоккею

Проанализируем результаты последних пяти чемпионатов мира, которые приведены в следующей таблице:

Таблица 1

М Команда ЧМ-2005 ЧМ-2004 ЧМ-2003 ЧМ-2002 ЧМ-2001

место/ранг место ранг место ранг место ранг место ранг

1 Канада 2 1 1 1 1 6 6 5 5

2 Швеция 4 2 2 2 2 3 3 3 3

3 Словакия 5 4 4 3 3 1 1 7 7

4 Чехия 1 5 5 4 4 5 5 1 1

5 Финляндия 8 6 6 5 5 4 4 2 2

6 США 6 3 3 13 13 7 7 4 4

7 РОССИЯ 3 10 10 7 7 2 2 6 6

8 Германия 15 9 9 6 6 8 8 8 8

9 Швейцария 7 8 8 8 8 10 10 9 9

10 Латвия 9 7 7 9 9 11 11 13 12

11 Австрия 16 11 11 10 10 12 12 11 11

12 Украина 11 14 14 12 12 9 9 10 10

13 Белоруссия 10 18 16 14 14 17 14 14 13

14 Дания 14 12 12 11 11 18 15 22 16

16 Словения 13 17 15 15 15 13 17 14

17 Казахстан 12 13 13 17 16 21 16 21 15

Из таблицы видно, что стабильность результатов у команд различна: так, сборная Швеции до последнего чемпионата была всегда в числе призеров, в то время как сборная России то поднималась до второго места, то опускалась до десятого. Попытаемся определить стабильность всех 16 команд-финалистов последнего чемпионата мира за последние пять лет. С этой целью построим корреляционную матрицу, сравнивая результаты всех команд за два года.

В качестве иллюстрации найдем коэффициент ранговой корреляции послед-

него чемпионата и ЧМ-2004. Для этого найдем сумму квадратов разностей соответствующих мест команд в эти годы:

^ ^ =(2-1)2+(4-2)2+(5-4)2+( 1-

5)2+(8-6)2+(6-3)2+(3-10)2+(15-9)2+(7-

8)2+(9-7)2+(16-11)2+(11-14)2+(10-

16)2+(14-12)2+(13-15)2+(12-13)2=204.

Используя формулу Спирмена, найдем коэффициент корреляции:

6 • 204

г8= 1-----------= 0,7

15•16•17

Аналогично вычисляем другие коэффициенты ранговой корреляции и получаем корреляционную матрицу:

г*=

ЧМ - 01 ЧМ - 02 ЧМ - 03 ЧМ - 04 ЧМ - 05

1 0,839 0,747 0,780 0,744

1 0,797 0,717 0,732

1 0,788 0,625

1 0,7

1

Откуда видно, что наиболее тесная связь (г8=0,839) между результатами ЧМ-2001 и ЧМ-2002, а кроме этого, во всех соседних чемпионатах, за исключение двух последних (г8=0,8), что объясняется устойчивостью (всего-то на два сезона) состава команд и тренерских штабов национальных сборных. Особенность сравнения итогов двух последних чемпионатов мира объясняется, прежде всего, локаутом в НХЛ в 2004-2005 гг., а отсюда участием практически всех сильнейших хоккеистов в сборных России, Чехии, Словакии, с од-

ной стороны, и отсутствием игровой практики многих профессионалов сборных США и Канады, с другой.

Обратим внимание на то, что при парной корреляции в данном случае возможно применение только коэффициента ранговой корреляции, поскольку чемпионаты мира проводятся по смешанной схеме с использованием и круговой системы, и игр с выбыванием.

2. Стабильность последних чемпионатов России

Приведем уже проранжированную таблицу последних трех регулярных чемпионатов и добавим еще места команд 2004-2005 гг. по результатам домашних и гостевых игр, по результатам игр только с командами верхней половины турнирной таблицы.

Таблица 2

М (1) Команда 2003-2004 (2) 2002-2003 (3) Дома (4) В гостях (5) С лучшими (6) С худшими (7)

1 Динамо 6 7 3 1 1 2

2 Лада 2 5 1 3 2 4

3 Металлург Мг. 1 6 2 5 6 1

4 Ак барс 5 4 5 2 4 3

5 Локомотив 7 1 6 4 3 8

6 Авангард 3 2 4 6 5 5

7 Металлург Нк. 4 9 7 8 9 7

8 Нефтехимик 8 11 9 7 11 6

9 Химик 12 16 8 12 12 9

10 ЦСКА 10 10 12 9 7 12

11 Северсталь 13 3 11 10 10 11

12 СКА 14 12 10 11 8 13

13 С. Юлаев 9 8 13 13 15 10

14 Сибирь 11 13 14 14 14 14

15 Спартак 15,5 14 15 15 13 16

16 Молот 15,5 15 16 16 16 15

2.1. Итоги последних трех регулярных чемпионатов России представим в виде полученной матрицы ранговых корреляций:

' 1 0,86 0,65^

( г ) = 1 0,66

. 1 .

Поскольку коэффициент корреляции г12 = 0,86, то последние два чемпионата характеризуются достаточно большой степенью стабильности, а сравнения с чемпионатом уже трехлетней давности, как и сами чемпионаты 2002-2003 и 20032004 годов, свидетельствуют о значительных их расхождениях.

2.2. О стабильности выступления команд в последнем чемпионате будем судить по вычисленной матрице ранговых корреляций между общим количеством очков (0) и очков, набранных в домашних (Д) и гостевых (Г) играх, в играх с лучшими (Л) и худшими (Х) командами.

О (1 0,97 0,96 0,9 0,94^

1 0,91

1

( ) =

= Д г

Л Х

0,86

0,93

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1

0,93

0,91

0,74

1

По элементам матрицы можно судить о достаточно высокой степени стабильности последнего хоккейного сезона. Исключение составляет только средняя связь (г = 0,74) между результатами команд с лучшими и худшими командами, которая может быть объяснена, в частности тем, что такую классификацию команды получили уже по итогам чемпионата.

Обратим внимание тренерских штабов команд СКА, ЦСКА, «Локомотива» и «С. Юлаева», результаты которых значительно лучше в играх с более сильными соперниками, на то, что это может быть резервом в организации учебно-тренировочного процесса при подготовке (особенно психологической) к следующему сезону.

3. Личные результаты игроков «Локомотива»

3.1. Результаты нападающих «Локомотива» в плей-офф и в чемпионате.

Найдем матрицу ранговых корреляций результативности нападающих и ими набранных штрафных минут в плей-офф и в регулярном чемпионате. С этой целью приведем статистические данные, которые проранжируем.

Таблица 3

Место Игрок Игр Гол+пас Ранг Нападающие Штрафники

очки ранг плей-офф регулярный

мин. ранг мин. ранг

1 Яшин А. 9 10(3+7) 1 6/10 7 10 8 14 8

2-3 Антропов Н. 9 7(3+4) 2,5 19/20 6 18 10 44 7

2-3 Королев И. 9 7(1+6) 2,5 28 5 2 2,5 26 1

4 Бут А. 8 6(3+3) 4 33 2 0 1 58 6

5 Ткаченко И. 9 5(2+3) 5 30 3 8 6 30 3

6 Счастливый П. 9 4(1+3) 6 29 4 2 2,5 28 2

7 Власенков Д. 9 2(2+0) 7 18 9 6 6 36 4

8-10 Крюков А. 7 1(1+0) 9 17 10 4 4 44 5

8-10 Непряев И. 9 1(1+0) 9 20 8 16 9 73 10

8-10 Антипов В. 7 1(0+1) 9 39 1 4 5 65 9

Обратим внимание на то, что А. Яшин и Н. Антропов в регулярном чемпионате сыграли только 10 и 26 матчей соответственно против почти 60 матчей у других, поэтому их рейтинги находились с этим учетом. Вычисления опускаем и приводим получившуюся корреляционную матрицу.

(1 0,17 - 0,05 0,26^

1 0,37 0,05

1 0,53

1 )

Отметим слабую связь (г8 = 0,17!) между очками, набранными нападающими «Локомотива» в плей-офф и в регулярном

(Г, ) =

чемпионате, на которую тренерскому штабу команды необходимо обратить внимание при подготовке к следующему хоккейному сезону. Практически независимы показатели результативности и нарушений правил нападающих (|гж| = 0,05),

существует средняя связь (г8 = 0,53) между нарушениями в плей-офф и в чемпионате, что может свидетельствовать об отсутствии особого ажиотажа среди нападающих в играх плей-офф по сравнению с регулярным чемпионатом.

3.2. Результаты нападающих и защитников «Локомотива» в регулярном

чемпионате.

Приведем раздельные результаты нападающих и защитников и проранжируем их (табл. 4, 5).

Таблица 4

Игрок Место-ранг Гол+пас Ранг по голам Ранг по передачам

Антипов В. 1 39(18-21) 1 1,5

Бут А. 2 33(12+21) 4 1,5

Ткаченко И. 3 30(15+15) 2,5 4,5

Счастливый П. 4 29(15+14) 2,5 6

Королев И. 5 28(8+20) 6,5 3

Непряев И. 6 20(10+10) 5,5 8

Анропов Н. 7 19(4+15) 11 5

Власенков Д. 8,5 18(10+8) 5,5 10

Швидкий Д. 8,5 18(7+11) 9 7

Крюков А. 10 17(8+9) 6,5 9

Шафигуллин Г. 11 10(5+5) 10 11

Самылин В. 12 6(2+4) 12 12

Галимов А. 13 2(1+1) 13 13

Таблица 5

Игрок Место-ранг Гол+пас Ранг по голам Ранг по передачам

Рязанцев А. 1 19(4+15) 6 1

Красоткин Д. 2,5 17(7+10) 1 4

Васильев А. 2,5 17(5+12) 4,5 2

Г орохов И. 4 16(5+11) 4,5 3

Рахунек К. 5 14(6+8) 2,5 5

Мерфи С. 6 12(6+6) 2,5 7

Штепанек М. 7 7(0+7) 9 6

Карповцев А. 8 6(2+4) 8 8

Жуков С. 9 4(3+1) 7 9

Сравним корреляционные матрицы связей набранных очков, голов и передач: для нападающих для защитников

очки (1 0,87 0,931 очки (1 0,53 0,951

голы 1 0,68

передачи ^ 1

Из приведенных корреляционных матриц видно, что и у нападающих и у защитников самая сильная прямая связь между очками и передачами, а у нападающих связь между очками и между голами и передачами значительно существенней, чем у защитников (сравни соот-

голы 1 0,37

передачи^ 1 J

ветствующие коэффициенты корреляции 0,87 и 0,53, а также 0,68 и 0,37).

4. Лучшие игроки чемпионата России

Представим результаты лучших игроков регулярного чемпионата и плей-офф и проранжируем их по числу набранных

№ п/п Игроки Очки Голы Пеі эедачи Плей - офф

Ранг Ранг Ранг Очки Ранг Голы Ранг Пере- дачи Ранг

1. М.Сушинский (Омск) 55 1 18 7,5 37 1 12 1 5 1 7 1

2. А.Кайгородов (Магнитогорск) 49 2 15 9 34 2 2 6 0 8 2 3,5

3. А. Морозов (Казань) 47 3 20 4 27 4 0 8,5 0 8 0 8

4. Д.Затонский (Омск) 46 4 23 1 23 6 6 2 3 3 3 2

5. П. Роса (Динамо) 44 5 21 3 23 6 5 3 3 3 2 3,5

6. А. Прокопьев (Омск) 43 6 14 10 29 3 3 4,5 3 3 0 8

7. И. Ковальчук (Казань) 42 7 19 5,5 23 6 0 8,5 0 8 0 8

8. А. Фролов (ЦСКА, Динамо) 40 9 22 2 18 10 3 4,5 2 5 1 5

9. Н. Жердев (ЦСКА) 40 9 19 5,5 21 8 0 8,5 0 8 0 8

10. В.Антипов (Ярославль) 40 9 18 7,5 22 9 0 8,5 0 8 0 8

4.1. Сравним результаты лучших игроков в регулярном чемпионате и в плей-офф. Регулярный чемпионат Плей - офф

очки Г1 - 0,13 0,89 > очки Г1 0,92 0,88 л

голы 1 - 0,52 голы 1 0,72

передачи V 1 ) передачи V 1 ,

И в регулярном чемпионате и в плей-офф самая сильная связь между очками и передачами (0,89 и 0,88), которая почти такая же и у игроков «Локомотива». Удивительный результат получен для связи между очками и голами в регулярном чемпионате (г = -0,13), что свидетельствует о независимости набранных очков и голов для лучших игроков, а в плей-офф для этих же игроков эта связь уже очень сильная (г = 0,92). Заметим большую схожесть матрицы ранговых корреляций для нападающих «Локомотива» в регулярном чемпионате и лучших игроков чемпионата в плей-офф (что бы это значило?)

4.2. Сравним соответствующие результаты лучших игроков в регулярном чемпионате и в плей-офф.

а) Набранные очки (голы + передачи).

Найдем сумму квадратов разностей рангов, набранных очков в чемпионате и в плей-офф.

^ ^ = (2-6)2 + (3-8,5)2 + (4-2)2 + (6-4,5)2 + (7- 8,5)2 + (9-4,5)2 + (9-8,5)2 +(9-8,5)2=77,5

6 77 5

Откуда г = 1---------— « 0,53 и связь прямая, хотя и средняя.

9-10•11

б) Заброшенные шайбы.

^ = 134 и г « 0,19 - связь слабая.

в) Передачи, с которых забрасывали шайбы.

^ = 95,5 и г « 0,42 - связь прямая и средняя.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Полученные результаты свидетельствуют о средней связи результатов лучших хоккеистов в регулярном чемпионате и в плей-офф, а по заброшенным шайбам эта связь и вовсе слабая, что должно бы насторожить тренеров команд.

В работе сделан один из первых шагов в использовании методов математической статистики к анализу итогов спортивных соревнований. Имеющейся литературы в этом направлении (см., например, [2], [3]) крайне мало, и она не может осветить даже малую толику проблем в научном осмыслении спортивной жизни, ее организации и подготовки к ней. Надеемся, что предложенный подход будет интересен и профессионалам, и любителям спорта.

Библиографический список

1. Афанасьев В.В. Теория вероятностей в вопросах и задачах. Ярославль: Изд-во ЯГПУ, 2004. 250 с.

2. Масальгин Н.А. Математико-статистические методы в спорте. М.: Физкультура и спорт, 1974. 151 с.

3. Садовский Л.Е., Садовский А. Л. Математика и спорт. М.:Наука, 1985. 192 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.